Неожиданная асимметрия между оптимизацией восприятия и оценкой

Аннотация

Перцептивная оптимизация в первую очередь определяется целевой функцией точности, которая обеспечивает как семантическую согласованность, так и общий визуальный реализм, в то время как состязательная целевая функция дополняет процесс, улучшая резкость восприятия и детализацию. Несмотря на их ключевую роль, взаимосвязь между их эффективностью как целей оптимизации и их способностью служить метриками оценки качества изображений (IQA) остается недостаточно изученной. В данной работе мы проводим систематический анализ и выявляем неожиданную асимметрию между перцептивной оптимизацией и оценкой: метрики точности, которые превосходно работают в IQA, не обязательно эффективны для перцептивной оптимизации, причем это несоответствие становится более выраженным при использовании состязательного обучения. Кроме того, хотя дискриминаторы эффективно подавляют артефакты в процессе оптимизации, их обученные представления предлагают лишь ограниченные преимущества при повторном использовании в качестве инициализации базовых моделей для IQA. Помимо этой асимметрии, наши результаты также показывают, что конструкция дискриминатора играет решающую роль в формировании оптимизации, причем архитектуры на основе патчей и сверток обеспечивают более точное восстановление деталей по сравнению с классическими или трансформерными альтернативами. Эти выводы углубляют понимание проектирования функций потерь и их связи с переносимостью IQA, прокладывая путь к более принципиальным подходам к перцептивной оптимизации.

English

Perceptual optimization is primarily driven by the fidelity objective, which enforces both semantic consistency and overall visual realism, while the adversarial objective provides complementary refinement by enhancing perceptual sharpness and fine-grained detail. Despite their central role, the correlation between their effectiveness as optimization objectives and their capability as image quality assessment (IQA) metrics remains underexplored. In this work, we conduct a systematic analysis and reveal an unanticipated asymmetry between perceptual optimization and assessment: fidelity metrics that excel in IQA are not necessarily effective for perceptual optimization, with this misalignment emerging more distinctly under adversarial training. In addition, while discriminators effectively suppress artifacts during optimization, their learned representations offer only limited benefits when reused as backbone initializations for IQA models. Beyond this asymmetry, our findings further demonstrate that discriminator design plays a decisive role in shaping optimization, with patch-level and convolutional architectures providing more faithful detail reconstruction than vanilla or Transformer-based alternatives. These insights advance the understanding of loss function design and its connection to IQA transferability, paving the way for more principled approaches to perceptual optimization.

Неожиданная асимметрия между оптимизацией восприятия и оценкой

The Unanticipated Asymmetry Between Perceptual Optimization and Assessment

Аннотация

Support