Аннотация:Дипломная работа посвящена задаче ранжирования документов по запросам, которая актуальна при построении Интернет-поисковиков: на запрос пользователя необходимо выдать список документов, причём наиболее релевантные (больше соответствуют запросу) должны находиться в вершине списка. Отметим, что это первая работа по этой теме, защищаемая на кафедре Математических методов прогнозирования. В работе рассмотрена реальная задача, предложенная участникам конкурса «Интернет-математика 2009», проводимого компанией «Яндекс».
Ахламченкова О.М. изучила существующие алгоритмы ранжирования документов, сделала их полный обзор. Отметим, что в настоящее время практически отсутствует русскоязычная литература по данной тематике. Дипломницей проведено исследование многих существующих алгоритмов ранжирования документов. Также предложен новый подход для решения задачи ранжирования, основанный на методах стохастической оптимизации алгебраических выражений. В предложенном подходе ранжирующая функция ищется в виде алгебраического выражения заданного вида. Это позволяет синтезировать «легко интерпретируемые» алгоритмы, поскольку в них понятно, как влияет каждое свойство пары «запрос-документ» на окончательное решение. Алгоритмы реализованы в системе MatLab.
В результате построены алгоритмы ранжирования документов в задаче конкурса «Интернет-Математика 2009». Предложенный дипломницей подход позволил быстро синтезировать эффективные алгоритмы. Отметим, что качество ранжирования всё-таки не достаточно высокое (по сравнению с существующими алгоритмами), кроме того, большая часть дипломной работы писалась «в последний момент» (также часть экспериментов делалась в спешке).