Аннотация:Магистерская диссертация посвящена задаче автоматического извлечения
устойчивых словосочетаний с терминами из научно-технических текстов.
Рассмотрены существующие методы выделения устойчивых словосочетаний из
текстовых коллекций. На базе существующих методов сформирован
собственный метод для извлечения словосочетаний с терминами, состоящий из
двух этапов:
• отбор кандидатов, опирающийся на методы лингвистического подхода;
• формирование окончательно списка устойчивых словосочетаний с
терминами, основанное на статистических методах и алгоритме
кластеризации.
Проведено экспериментальное исследование работы предложенного
метода на текстах из предметной области «Искусственный интеллект», которое
показало его состоятельность.