Аннотация:В данной работе предлагаются модификации сиамских сетей, улучшающие качество и точность классификации. Популярными методами обучения сиамских сетей являются Contrastive Loss [1], Triplet Loss [19], их модификации Quadruplet Loss [2], но до текущего момента времени модель плохо либо вообще не учитывала иерархическое взаимоотношение объектов и тот факт, что объекты могут быть неравнозначными. Например, сеть классифицирует картинки по тому, что на них изображено: кошки, собаки, машины и т. д., см. рис. 1. Для обычной модели все классы непохожи в одинаковой степени, что в действительности не так. Различия между кошкой и собакой, а, тем более, их породами должно быть намного меньше, чем различия объектами классов из разных областей, таких как собака и катер. В работе показывается, что если учитывать информацию о степени непохожести классов посредством их иерархии, то можно существенно улучшить качество классификации.
Предлагаемый в работе подход позволяет учитывать иерархию объектов и цену ошибки за неправильную классификацию — например, животные в одной группе, техника во второй, группа животных делится на собак, кошек и т. д., при этом за неправильное определение породы модель штрафуется слабее, чем за плохой прогноз, когда она перепутала классы, относящиеся к разным областям, например, определила машину как животное. Предложенный метод позволяет на первых этапах учить модель различать базовые группы — животных от машин, мебель от растений и так далее, а на поздних стадиях выучиваются внутриклассовые различия — породы собак, марки машин и т. п. В рамках
работы были проведены эксперименты, показывающие улучшение качества классификации относительно базовых подходов на задачах
классификации изображений и текстов.