Методы и алгоритмы дистрибутивной семантики - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Арефьев Н.В.
Автор: Лесота O.O.,
Тип: Специалист
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2015
Аннотация: В данной работе предлагаются улучшения существующих моделей векторного представления семантики слова. Первое улучшение – обучение модели, основанной на поточечной взаимной информации, на данных о частотности N-грамм, извлеченных из электронной библиотеки Google Books (проект Google N-grams). Второе – автоматическое разрешение лексической неоднозначности в тексте, подаваемом на вход нейросетевому методу построения семантических векторов. Для оценки каждого из улучшений построена соответствующая система. В работе подробно рассматриваются особенности систем и результаты оценки. Обучение на Google N-grams не дало удовлетворительных результатов, это связано с некоторыми особенностями исходных данных. Однако, из этого не следует неэффективность такого подхода. Система разрешения лексической неоднозначности демонстрирует обнадеживающие результаты, проведенные исследования показывают, что система способна выделять доминантные значения слов. При этом системе не требуется никаких размеченных данных.
Добавил в систему: Арефьев Николай Викторович

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Методы и алгоритмы дистрибутивной семантикидипломная работа (Специалист)