Применение методов сверхразрешения изображений для повышения точности оптического распознавания текстов - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Половников В.С.
Автор: Шарапов Т.И.
Тип: Магистр
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2020
Аннотация: Решается задача увеличения текста на изображении для улучшения качества оптического распознавания (OCR). В своей работе автор применил известные нейросетевые методы DCSCN и SRGAN, которые решают задачу сверхразрешения общего назначения и показал несостоятельность оценки качества с помощью общепринятых показателей PSNR, SSIM. Автор составил генератор искусственных изображений, подготовил собственную базу данных реальных изображений текста с различных устройств, разработал специфическую систему аугментации изображений текста, провёл обучение легковесной модели CARN и показал её превосходство над классическими подходами как в вычислительной сложности и времени работы, так и в качестве распознавания. Для оценки точности распознавания было использовано расстояние Левенштейна, позволяющее судить о качестве работы OCR на увеличенном изображении. Для удобства тестирования и демонстрации результатов модель была развернута в виде веб-сервиса.
Добавил в систему: Половников Владимир Сергеевич

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Применение методов сверхразрешения изображений для повышения точности оптического распознавания текстовдипломная работа (Магистр)