Сравнение трансформеров, диффузионных моделей и генеративно-состязательных сетей в задаче сверхразрешения с использованием одного изображениядипломная работа (Бакалавр)
Аннотация:В работе изучаются передовые подходы решения задачи сверхразерешия с использованием одного изображения, сравнивается качество моделей на медицинском датасете fastMRI, состоящем из множества необработанных МРТ снимков. Особенностью этого набора данных является наличие истинного высокодетализированного изображения для каждого предложенного снимка.
Рассмотрены нейронные сети трансформеры, которые с помощью механизма внимания позволяют находить взаимосвязи между разными участками изображения как в исходном пространстве, так и в признаковом пространстве. Последний из предложенных подходов – диффузионные модели, восстанавливающие изображение постепенно маленькими порциями. Во многих областях диффузионные модели показывают лучшее качество по сравнению с другими подходами. Студенту удалось обучить модели Swin Transformer, DCGan, SR3, MedFusion на выбранном датасете. Также он предложил применить геометрическую аугментацию (повороты, сдвиги, масштабирование), адаптированную к виду данных, для увеличения обучающего множества, преодоления проблемы переобучения, улучшения качества модели. В качестве метрик точности реконструкции использовались PSNR, SSIM, NMSE. Проведенные исследования показали, что сеть, основанная на архитектуре «трансформер» больше подходит для обработки медицинских снимков.