Аннотация:На части датасета VisDrone, содержащей 79 видео файлов (суммарно 33366 кадров), апробированы рахзличные алгоритмы трекинга и модели нейронных сетей, решающие задачу детектирования объектов. В процессе работы была выявлены проблемы дисбаланса классов в датасете, а также дисбаланс в плотности расположения объектов, которые студентка решила, предложив оригинальный способ аугментации данных и использование внешних данных (датасет UAVDT). Предложенный подход универсальный и может быть применен при решении задачи детектирования на других датасетах.
В работе описаны многочисленные эксперименты с нейросетевыми детекторами семейства Yolo, алгоритмами трекинга OC-SORT, ByteTrack, DeepSORT и StrongSORT, показана эффективность предложенных методов борьбы с дисбалансом данных, показано превосходство связки детектора Yolov5, алгоритма трекинга StrongSORT с гауссовским сглаживанием над альтернативными подходами в решении поставленной задачи.