ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
На сегоднящний день одним из эффективных способов построения поисковой системы является отображение поисковых едининц в Евклидово пространство фиксированной размерности. Такой подход применяется к данным различной модальности, и, зачастую, используется особенность самой природы данных. Так, например, в текстовых данных эффективным оказывается применение структуры инвертированного индекса, снижая время обработки запроса до минимума. В тоже самое время, применение общего подхода, к вложению данных в конеченомерное пространство имеет свои ограничения. С одной стороны, с ростом количества документов несложно заметить, что точность поиска будет ухудшаться. С другой стороны, при фиксированном количестве документов, верно ли, что точность поиска будет ухудшаться с уменьшением размерности пространства?