Корпус фольклорных текстов и кластеризация указателей сюжетов - доклад на конференции | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Автор: Потемкин С.Б.
Международная Конференция : Корпусная лингвистика - 2019
Даты проведения конференции: 24-28 июня 2019
Дата доклада: 27 июня 2019
Тип доклада: Устный
Докладчик: Потемкин С.Б.
Место проведения: Петербург, Russia
Аннотация доклада:
The corpus of fairy tales for Russian and English is compiled with the goal of introduction of folklore material in machine-readable form. The corpus allows one to create concordances, frequency dictionaries, invoke full texts, etc. On the basis of the corpora tools are developed for calculating the semantic proximity of plots, the graphical presentation of plots and clustering of the resulting graphs. In this context semantic proximity is understood as the number of matching tokens, taking into account the sequence of their appearance in the text. Корпус сказок для русского и английского языка составлен с целью включения в научный оборот фольклорного материала, имеющегося в машиночитаемой форме. Корпус позволяет создавать конкордансы, частотные словари, вызывать полные тексты и пр. На основе корпуса разработаны средства вычисления семантической близости сюжетов, графического представления сюжетов и кластеризации полученных графов. Семантическая близость в данном случае понимается как число совпадающих лексем с учетом последовательности их появления в тексте.

Доклад на конференции выполнен в рамках проекта (проектов):

Технологии формирования интерактивных адаптивных мультимедийных электронных образовательных ресурсов (ЭОР) по филологии

Добавил в систему: Потемкин Сергей Борисович

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Корпус фольклорных текстов и кластеризация указателей сюжетовдоклад на конференции