Применение методов машинного обучения с подкреплением в рекомендательных системах - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Рыжов А.П.
Автор: Селин Д.И.
Тип: Специалист
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2018
Аннотация: Большинство известных на данный момент рекомендательных систем основаны на прогнозировании неизвестных оценок объектов по уже известным и предложении пользователю объекта с максимальной из предсказанных оценок. Однако, можно заметить что процесс рекомендации обладает структурой задачи машинного обучения с подкреплением: у пользователя есть различные состояния в зависимости от того какие объекты он выбрал последними, есть действия - выбор объекта для рекомендации, и есть реакция - отклик пользователя, оценка рекомендованному объекту. В данной работе рассматривается построение модели рекомендальной системы на основе Марковского процесса управления и решение задачи поиска оптимальной последовательности рекомендаций. Ключевые слова: рекомендательные системы, машинное обучение, ма- шинное обучение с подкреплением, Марковский процесс управления, Q-обучение.
Добавил в систему: Рыжов Александр Павлович

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Применение методов машинного обучения с подкреплением в рекомендательных системахдипломная работа (Специалист)