Аннотация:Классические методы детектирования объектов на основе гистограмм ориентированных градиентов (HOG) и метода деформируемых частей (DPM) хоть и уступили лидирующие позиции по скорости и точности детектирования объектов подходам на базе свёрточных нейронных сетей, но могут оказаться полезными для решения обозначенных выше подзадач построения нейронных сетей.
В первой части работы Сергей изучает скорости движения областей изображения по расположению ключевых точек на соседних кадрах видеоряда. Приводится эффективный алгоритм фильтрации для исключения ошибок алгоритмов поиска и сопоставления ключевых точек. По ключевым точкам, используя триангуляцию Делоне, восстанавливаются вектора движения каждой точки изображения. Исходя из полученных характеристик можно выделить зоны интереса алгоритма детектирования, чем примерно в пять раз уменьшить вычислительную сложность и повысить точность, исключив некоторые ложные срабатывания алгоритма на тестовой выборке.
Во второй части Кузин С.С. строит сверточную нейронную сеть, которая моделирует классический алгоритм DPM и приближает (ввиду использования сигмоидной функции активации вместо ступенчатой и особенностей нормализации) его работу. Тем самым решается подзадача выбора архитектуры и инициализации весов нейронной сети. Сергей сравнивает результаты базового подхода с его нейросетевой реализацией. Далее проводится дообучение нейронной сети методом стохастического градиентного спуска (SGD) и показывается улучшение по сравнению с базовым классическим алгоритмом DPM.