ChatPaper.aiChatPaper

SmartPhotoCrafter: Ragionamento, Generazione e Ottimizzazione Unificati per l'Editing Fotografico Automatico delle Immagini

SmartPhotoCrafter: Unified Reasoning, Generation and Optimization for Automatic Photographic Image Editing

April 21, 2026
Autori: Ying Zeng, Miaosen Luo, Guangyuan Li, Yang Yang, Ruiyang Fan, Linxiao Shi, Qirui Yang, Jian Zhang, Chengcheng Liu, Siming Zheng, Jinwei Chen, Bo Li, Peng-Tao Jiang
cs.AI

Abstract

L'editing tradizionale delle immagini fotografiche richiede solitamente che gli utenti possiedano una sufficiente comprensione estetica per fornire indicazioni appropriate sulla regolazione della qualità dell'immagine e dei parametri della fotocamera. Tuttavia, questo paradigma si basa su istruzioni umane esplicite dell'intento estetico, che sono spesso ambigue, incomplete o inaccessibili agli utenti non esperti. In questo lavoro proponiamo SmartPhotoCrafter, un metodo di editing automatico di immagini fotografiche che formula l'editing come un processo strettamente accoppiato di ragionamento-generazione. Il modello proposto esegue prima una comprensione della qualità dell'immagine e identifica le carenze tramite il modulo Image Critic, successivamente il modulo Photographic Artist realizza modifiche mirate per migliorare l'attrattiva dell'immagine, eliminando la necessità di istruzioni umane esplicite. Viene adottata una pipeline di addestramento multi-fase: (i) Pre-addestramento di base per stabilire comprensione estetica e capacità di editing fondamentali, (ii) Adattamento con supervisione multi-modifica guidata dal ragionamento per incorporare una ricca guida semantica, e (iii) Apprendimento per rinforzo coordinato ragionamento-generazione per ottimizzare congiuntamente ragionamento e generazione. Durante l'addestramento, SmartPhotoCrafter enfatizza la generazione di immagini foto-realistiche, supportando sia compiti di restauro che di ritocco dell'immagine con coerenza verso la semantica relativa a colore e tono. Abbiamo anche costruito un dataset specifico per fase, che costruisce progressivamente ragionamento e generazione controllabile, efficace collaborazione cross-modulo e infine un enhancement fotografico di alta qualità. Gli esperimenti dimostrano che SmartPhotoCrafter supera i modelli generativi esistenti nel compito di enhancement fotografico automatico, ottenendo risultati foto-realistici mostrando al contempo una maggiore sensibilità tonale alle istruzioni di ritocco. Pagina del progetto: https://github.com/vivoCameraResearch/SmartPhotoCrafter.
English
Traditional photographic image editing typically requires users to possess sufficient aesthetic understanding to provide appropriate instructions for adjusting image quality and camera parameters. However, this paradigm relies on explicit human instruction of aesthetic intent, which is often ambiguous, incomplete, or inaccessible to non-expert users. In this work, we propose SmartPhotoCrafter, an automatic photographic image editing method which formulates image editing as a tightly coupled reasoning-to-generation process. The proposed model first performs image quality comprehension and identifies deficiencies by the Image Critic module, and then the Photographic Artist module realizes targeted edits to enhance image appeal, eliminating the need for explicit human instructions. A multi-stage training pipeline is adopted: (i) Foundation pretraining to establish basic aesthetic understanding and editing capabilities, (ii) Adaptation with reasoning-guided multi-edit supervision to incorporate rich semantic guidance, and (iii) Coordinated reasoning-to generation reinforcement learning to jointly optimize reasoning and generation. During training, SmartPhotoCrafter emphasizes photo-realistic image generation, while supporting both image restoration and retouching tasks with consistent adherence to color- and tone-related semantics. We also construct a stage-specific dataset, which progressively builds reasoning and controllable generation, effective cross-module collaboration, and ultimately high-quality photographic enhancement. Experiments demonstrate that SmartPhotoCrafter outperforms existing generative models on the task of automatic photographic enhancement, achieving photo-realistic results while exhibiting higher tonal sensitivity to retouching instructions. Project page: https://github.com/vivoCameraResearch/SmartPhotoCrafter.
PDF50April 23, 2026