Аннотация:Дипломная работа посвящена задаче ранжирования документов по запросам, которая актуальна при построении Интернет-поисковиков: на запрос пользователя необходимо выдать список документов, причём наиболее релевантные (больше соответствуют запросу) должны находиться в вершине списка. В работе рассмотрена реальная задача, предложенная участникам конкурса «Интернет-математика 2009», проводимого компанией «Яндекс».
Платонова Е.В. изучила существующие алгоритмы ранжирования документов, сделала их полный обзор. Дипломницей проведено исследование многих существующих алгоритмов ранжирования документов. Также предложен новый подход для решения задачи ранжирования, основанный на методах градиентной оптимизации. В предложенном подходе ранжирующая функция ищется в виде алгебраического выражения заданного вида. Это позволяет синтезировать «легко интерпретируемые» алгоритмы, поскольку в них понятно, как влияет каждое свойство пары «запрос-документ» на окончательное решение. Алгоритмы реализованы в системе MatLab.
Также Платонова Е.В. реализовала алгоритмы «попарного» подхода к ранжированию, в котором задача сводится к классической задаче регрессии (или даже классификации). Отметим, что дипломнице пришлось изучить несколько математических систем (Matlab, R) и специализированных пакетов.
В результате построены алгоритмы ранжирования документов в задаче конкурса «Интернет-Математика 2009». Предложенный дипломницей подход позволил быстро синтезировать эффективные алгоритмы. Отметим достаточно высокое качество ранжирования (по сравнению с существующими алгоритмами).