Аннотация:В данной статье рассмотрены подходы к оптимизации обработки изображений на графическом процессоре на примере алгоритма медианной фильтрации. Производится сравнение со свободно распространяемой библиотекой обработки изображений на центральном процессоре, в которой используются векторные инструкции AVX2. Достигнутая скорость фильтрации квадратом 3х3 в 100 GPixels/sec для GPU Titan Pascal и удельная скорость фильтрации квадратом 3х3 в 10.2 GPixels/sec на 1 TFlops для одинарной точности на данное время являются самыми высокими из всех известных в мире.