Аннотация:Выпускная работа посвящена разработке математической модели и метода построения линий, описывающих траекторию движения пера при рукописном письме. При этом исходными данными является цифровое изображение рукописного текста, полученное в результате сканирования бумажного документа. Такая модель позволяет использовать для распознавания сканированного рукописного документа методы, которые применяются в on-line распознавании рукописного письма в современных компьютерах и мобильных устройствах. Тема распознавания текста в цифровых изображениях рукописных документов является актуальной для работы с историческими архивами, с массивами экзаменационных работ школьников и т.п.
В работе предложен подход, основанный на следующих принципах.
1. Траектория пера описывается в виде «линии на растре» шириной в один пиксел. При этом последовательность пикселей упорядочена в соответствии с движением пера.
2. Множество пикселей, входящих в состав траектории, формируется из дискретного скелета исходного бинарного изображения текста.
3. Последовательность обхода пикселей скелета определяется на основе марковского процесса принятия решений. Параметры решений определяются методом машинного обучения с подкреплением.
Автором разработаны вычислительные методы и алгоритмы, позволяющие реализовать этот подход. Выполнена программная реализация разработанных алгоритмов, которая позволяет оценить работоспособность и эффективность предложенного решения на материале реальных сканированных документов.