ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
Диссертация посвящена исследованию задачи извлечения терминологической информации из заданного научно-технического текста на русском языке. В работе получены следующие основные результаты: 1. Предложен подход, позволяющий единообразно формализовать в виде лексико-синтаксических шаблонов структуру терминологических словосочетаний, а также конструкции и варианты их употребления. 2. В рамках предлагаемого подхода разработаны процедуры извлечения из текста терминологической информации, опирающиеся на ее формальное описание в виде шаблонов и допускающие настройку за счет изменения используемого набора шаблонов. 3. Разработанные процедуры программно реализованы, проведено их экспериментальное исследование на базе созданного набора шаблонов. 4. По результатам экспериментального исследования предложена стратегия объединения результатов разработанных процедур, позволяющая в целом улучшить показатели точности и полноты извлечения терминов из текста.