Путь пикселя от ввода к результату

📥
Входное изображение
RAW / JPEG / PNG
🎨
Препроцессинг
Нормализация / Тайлинг
🧠
ИИ-модель
Инференс GPU
🔗
Сшивка тайлов
Blend / Overlap
📤
Результат
16-bit / HDR
Суперразрешение · Апскейлинг

Real-ESRGAN
v2.0

Enhanced Super-Resolution Generative Adversarial Network — генеративная сеть для слепого суперразрешения реальных фотографий с неизвестным типом деградации.

В отличие от классического ESRGAN, Real-ESRGAN обучен на синтетических парах с реалистичными деградациями: гауссовый шум, JPEG-артефакты, кинопленочное зерно, смаз, хроматические аберрации.

PyTorch 2.x RRDB × 23 блока Персептивные потери ×2 / ×4 / ×8 16.7M параметров FP16 / INT8
PSNR (Set5)32.94 dB
SSIM0.902
LPIPS (перцептуальное)0.051
Скорость · RTX 4070 · 1024px~0.8 с

Архитектура генератора: RRDB (Residual-in-Residual Dense Block) с 23 блоками, дискриминатор U-Net с добавлением спектральной нормализации.

Трансформер · Восстановление

SwinIR //
Image Restoration

Swin Transformer для восстановления изображений. Использует оконное мультиголовое самовнимание (W-MSA) с кросс-оконными сдвигами для захвата как локальных, так и глобальных зависимостей.

Идеально справляется с классическим шумоподавлением (AWGN), JPEG-артефактами и суперразрешением с явным масштабным коэффициентом.

Swin Transformer v2 96×96 окна L1 + Перцептивные потери 180 × RSTB блоков 11.8M параметров
Шумоподавление · σ=5031.67 dB
Убр. JPEG-артефактов · Q=1032.44 dB
SR ×4 · BSD10028.77 dB
Генеративная · Лица

GFPGAN
Face Restoration

Generative Facial Prior GAN — восстановление лиц с помощью предобученного StyleGAN2 в качестве «умного» prior'а. Модель знает, как должно выглядеть человеческое лицо на уровне фундаментальных статистических закономерностей.

StyleGAN2 prior Pyramid Restoration Channel Split Spatial FaceLib landmarks ~338M параметров

Возможности

  • ✓ Восстановление глаз высокой детализации
  • ✓ Текстура кожи без пластического эффекта
  • ✓ Волосы, брови — каждый волосок
  • ✓ Сохранение идентичности (identity preservation)
  • ✓ До 8 лиц на изображении одновременно

Выберите правильную модель

Real-ESRGAN
ЗадачаАпскейлинг ×2–8
VRAM (мин.)4 ГБ
Скорость 4K~3 сек
ПортретыХорошо
ПейзажиОтлично
ДокументыОтлично
SwinIR
ЗадачаШум / JPEG / SR
VRAM (мин.)3 ГБ
Скорость 4K~2 сек
ПортретыОтлично
ПейзажиОтлично
ДокументыХорошо
GFPGAN
ЗадачаВосстановление лиц
VRAM (мин.)6 ГБ
Скорость 4K~5 сек
ПортретыНаилучшее
ПейзажиН/Д
ДокументыН/Д

Все метрики получены на тестовых датасетах Set5/BSD100/FFHQ при разрешении входного изображения 512×512. Скорость измерена на RTX 4070 при тайлинге 512px.