Аннотация:Магистерская диссертация Иванова Сергея Максимовича посвящена одной из самых динамично развивающихся областей машинного обучения – «обучению с подкреплением». В работе рассматривается введение дополнительной награды, которая мотивирует агента исследовать среду и демонстрировать «интеллектуальное» поведение даже в сложных средах с разреженной основной наградой (почти всегда равна константе). Такое введение (с некоторыми оговорками) называется «любопытством». Автор исследует любопытство с различными алгоритмами обучения с подкреплением (при on-policy и off-policy подходе).