Любопытство в обучении с подкреплением - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Дьяконов А.Г.
Автор: Иванов Сергей Максимович
Тип: Магистр
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2020
Аннотация: Магистерская диссертация Иванова Сергея Максимовича посвящена одной из самых динамично развивающихся областей машинного обучения – «обучению с подкреплением». В работе рассматривается введение дополнительной награды, которая мотивирует агента исследовать среду и демонстрировать «интеллектуальное» поведение даже в сложных средах с разреженной основной наградой (почти всегда равна константе). Такое введение (с некоторыми оговорками) называется «любопытством». Автор исследует любопытство с различными алгоритмами обучения с подкреплением (при on-policy и off-policy подходе).
Добавил в систему: Дьяконов Александр Геннадьевич

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА