Место издания:Издательство Самарского университета Самара
Номер статьи:042492
Аннотация:Векторные представления слов активно используются в задачах машинного перевода, рекомендательных системах и информационном поиске. В данном исследовании проверяется гипотеза о том, что в четвёрках слов, для которых несколькими независимыми методами были получены одинаковые порядки на расстояниях между словами, монотонных четвёрках, содержится информация об истинном порядке для четвёрок с разным порядком, антимонотонных четвёрок. Проверяется, что в случае определения истинного порядка и построения векторных представлений на основе исходных и восстановленных монотонных четвёрок, качество векторных представлений слов повышается. Предложены метод отбора четвёрок слов, модель построения скорректированных векторных представлений слов и способ сравнения качества исходных и полученных в ходе коррекции векторных представлений слов.