Выделение именованных сущностей из новостных текстов с использованием информации из Википедии - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Головин Игорь Геннадьевич
Автор: Сарбасова Ажар Мухамеджановна
Тип: Специалист
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2015
Аннотация: В работе рассматривается проблема извлечения именованных сущностей из новостных текстов с использованием информации из Википедии. Разработана программа, которая которая автоматически строит языковую модель для системы Stanford NER по выбранному подмножеству статей из Википедии и сервиса Викиданных. При адекватном выборе подмножества вики-статей обученная модель меньше «зашумливается» данными из несмежных областей. Полученная модель далее применяется для автоматической разметки именованных сущностей.
Добавил в систему: Головин Игорь Геннадьевич

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА