Аннотация:Работа Крутоярского М.Л. находится в русле работ, посвященных совершенствованию алгоритмов поиска текстовой информации на основе учета семантической близости текстов. Первый всплеск исследований в этом направлении возник в России и за рубежом в 60-х годах XX века (задачи автоматического реферирования и индексирования, автоматического перевода текстов и др.) и получил дополнительный импульс с развитием глобальных информационных сетей (например, интернет) и корпоративных хранилищ данных, насчитывающих миллиарды единиц текстов. Формальные статистические методы имеют естественные ограничения для задачи сравнения текстов; семантическая близость в классическом понимании требует огромных затрат на ввод информации в систему (различные классификаторы, рубрикаторы и пр.) и применяется лишь в специализированных системах. Поэтому сравнение произвольных текстов на основе семантической близости является актуальной и востребованной задачей.