Аннотация:Цель работы заключается в поиске приближенно оптимального пути для обхода множества точек на плоскости группой машин Дубинса. Под оптимальностью понимается минимум затраченного времени на полный путь. Особенность обхода заключается в том, что объект управления движется при постоянной скорости и имеет ограничения на допустимый угол поворота. В первую очередь рассматривается случай обхода одной машиной некоторого фиксированного набора точек для выявления возможности поиска оптимального пути.
Предлагается использовать практики из систем интеллектуального управления, а именно – методы обучения с подкреплением. Данный выбор обусловлен отсутствием «правильных» траекторий, как, например, в классической задаче обучения с учителем. Также подход ценен свободой моделирования системы управления. На получение положительного результата будут влиять свойства среды, характеристики агента (машины Дубинса) и способы оценки, благодаря которым мы будем определять «правильность» действий.
Для реализации среды и методов обучения используется язык Python 3. Модели реализованы при помощи библиотеки глубокого обучения «torch» и имеют возможность использовать быстрые вычисления на графическом процессоре благодаря технологии CUDA.