Аннотация:Была поставлена задача найти реализацию и разобраться с одной из лидирующих архитектур нейросетевых детекторов Faster RCNN на примере задачи поиска надписей на фотографиях. Подобное детектирование может быть использовано, например, для анализа наружной рекламы, рекламы на транспортных средствах. Особенность задачи состоит в форме искомых объектов, разнообразии шрифтов и цветовых решений, углов съёмки и многообразии фонов. А также характеризуется сложностью составления базы реальных снимков.
В работе предложен и протестирован алгоритм построения базы данных искусственных изображений, используются различные подходы к аугментации базы данных, внесены модификации в реализацию для поддержки различных соотношений сторон искомых объектов более подходящих для поиска надписей, подобраны параметры и пороги детектора, проведено обучение и тестирование, сравнение эффективности полученного решения с базовым.