Сравнение трансформеров, диффузионных моделей и генеративно-состязательных сетей в задаче сверхразрешения с использованием одного изображения - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Половников В.С.
Автор: Шарапов Р.И.
Тип: Бакалавр
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2023
Аннотация: В работе изучаются передовые подходы решения задачи сверхразерешия с использованием одного изображения, сравнивается качество моделей на медицинском датасете fastMRI, состоящем из множества необработанных МРТ снимков. Особенностью этого набора данных является наличие истинного высокодетализированного изображения для каждого предложенного снимка. Рассмотрены нейронные сети трансформеры, которые с помощью механизма внимания позволяют находить взаимосвязи между разными участками изображения как в исходном пространстве, так и в признаковом пространстве. Последний из предложенных подходов – диффузионные модели, восстанавливающие изображение постепенно маленькими порциями. Во многих областях диффузионные модели показывают лучшее качество по сравнению с другими подходами. Студенту удалось обучить модели Swin Transformer, DCGan, SR3, MedFusion на выбранном датасете. Также он предложил применить геометрическую аугментацию (повороты, сдвиги, масштабирование), адаптированную к виду данных, для увеличения обучающего множества, преодоления проблемы переобучения, улучшения качества модели. В качестве метрик точности реконструкции использовались PSNR, SSIM, NMSE. Проведенные исследования показали, что сеть, основанная на архитектуре «трансформер» больше подходит для обработки медицинских снимков.
Добавил в систему: Половников Владимир Сергеевич

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН