1 of 14

Использование диффузионной модели для задачи увеличения изображения

Калязин Николай

2 of 14

Диффузионные модели являются сильным инструментом для решения различных задач компьютерного зрения. Их способность генерировать изображение помогает и в задачах восстановления изображений

Использование предобученной диффузионной модели для решения задач восстановления изображение стало популярным направлением в научном сообществе в последние два года

Существует большое количество различных деградаций, под которые надо обучать новую диффузионную модель, что может слишком затратно как по времени, так и по вычислительным ресурсам

2024

Мотивация

3 of 14

01.

Задача восстановления изображений

2024

4 of 14

Что такое Image Restoration?

Low Quality Image (LQ)

High Quality Image (HQ)

Модуль, который улучшает качество изображения

5 of 14

Какие есть деградации?

  • Есть два типа деградаций, которые интересуют:
    • Линейные деградации: уменьшение размера изображение, маскирование картинки для Inpainting, гауссовский блюр
    • Нелинейные деградации: неоднородной блюр, JPEG компрессия, Phase Retrieval, и разные комбинации нелинейных деградаций с линейными
  • Также деградации делятся на синтетические и реальные, первые получаются с помощью заданных заранее операторов деградации, другие получаются в результате работы камеры

6 of 14

Виды деградаций

7 of 14

02.

Алгоритм восстановления изображения с помощью градиента

2024

8 of 14

Classifier Guidance

9 of 14

FreeDoM: Training-Free Energy-Guided Conditional Diffusion Model

10 of 14

Коррекция градиента

11 of 14

03.

Результаты работы

2024

12 of 14

Количественные результаты

Метод

CelebaHQ

ImageNet

FreeDoM

29.06

24.12

Momentum

29.29

24.08

Adam

28.75

23.34

13 of 14

Визуальные результаты на CelebaHQ

14 of 14

Визуальные результаты на ImageNet