Модель "АТОМ" в задаче информационного поиска и ответа на запрос с использованием архитектуры нейронных сетей - отчет | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Автор: Тарлинский И.В.
Организация: МГУ имени М.В. Ломоносова
Подразделение: Кафедра теоретической информатики
Номер: 1
Год выпуска: 2021
Количество страниц: 20
Аннотация:
В высоконагруженных системах, рабоающих с многомиллиардными документами, требуется быстрая и точная обработка огромных потоков данных. Для этой цели встраивается компонент, который, как правило, обозначают "R" (англ. «Retriever»). Математически, "R" - есть функция, которая по заданному запросу пользователя "q" и огромной базе документов "C", позволяет получить небольшое (не более десяти) множество данных, наиболее подходящих для детального анализа. Классическим подходом до сих пор остается использование статистических методов вложения данных, например, известный алгоритм "BM25", который в силу особенности вложения текстовых документов работает быстро и точно, однако сильно ошибается на данных, богатых словами-омонимами или описанных морфологически сложным и богатым языком. Возникает вопрос: можно ли реализовать систему поиска, которая будет не сильно проигрывать "BM25" в скорости и очень сильно выигрывать в точности, моделируя вложение данных нейронными сетями, учитывающими контекст, такими как, например "BERT" ?
Добавил в систему: Тарлинский Игорь Викторович

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Модель "АТОМ" в задаче информационного поиска и ответа на запрос с использованием архитектуры нейронных сетейотчет

Прикрепленные файлы