ChatPaper.aiChatPaper

SmartPhotoCrafter: Geïntegreerd Redeneren, Genereren en Optimaliseren voor Automatische Fotobewerking

SmartPhotoCrafter: Unified Reasoning, Generation and Optimization for Automatic Photographic Image Editing

April 21, 2026
Auteurs: Ying Zeng, Miaosen Luo, Guangyuan Li, Yang Yang, Ruiyang Fan, Linxiao Shi, Qirui Yang, Jian Zhang, Chengcheng Liu, Siming Zheng, Jinwei Chen, Bo Li, Peng-Tao Jiang
cs.AI

Samenvatting

Traditionele bewerking van fotografische beelden vereist doorgaans dat gebruikers voldoende esthetisch inzicht hebben om passende instructies te kunnen geven voor het aanpassen van beeldkwaliteit en cameraparameters. Dit paradigma berust echter op expliciete menselijke instructie van esthetische intentie, die vaak ambigu, incompleet of ontoegankelijk is voor niet-deskundige gebruikers. In dit werk stellen we SmartPhotoCrafter voor, een automatische methode voor het bewerken van fotografische beelden die beeldbewerking formuleert als een sterk gekoppeld redeneer-naar-generatieproces. Het voorgestelde model voert eerst beeldkwaliteitsbegrip uit en identificeert tekortkomingen via de Image Critic-module, waarna de Photographic Artist-module gerichte bewerkingen uitvoert om de aantrekkingskracht van het beeld te vergroten, waardoor expliciete menselijke instructies overbodig worden. Er wordt een meerfasig trainingspipeline gebruikt: (i) Foundation-pre-training om basisesthetisch begrip en bewerkingscapaciteiten op te bouwen, (ii) Adaptatie met redeneringsgestuurde multi-edit supervision om rijke semantische begeleiding te incorporeren, en (iii) Gecoördineerde redeneer-naar-generatie versterkend leren om redenering en generatie gezamenlijk te optimaliseren. Tijdens de training benadrukt SmartPhotoCrafter foto-realistische beeldgeneratie, terwijl het zowel beeldherstel- als retoucheertaken ondersteunt met consistente aandacht voor kleur- en toon gerelateerde semantiek. We construeren ook een fase-specifieke dataset, die progressief redenering en controleerbare generatie, effectieve cross-module samenwerking en uiteindelijk hoogwaardige fotografische verbetering opbouwt. Experimenten tonen aan dat SmartPhotoCrafter bestaande generatieve modellen overtreft bij de taak van automatische fotografische verbetering, waarbij het foto-realistische resultaten bereikt en tegelijkertijd een hogere tonale gevoeligheid voor retoucheerinstructies vertoont. Projectpagina: https://github.com/vivoCameraResearch/SmartPhotoCrafter.
English
Traditional photographic image editing typically requires users to possess sufficient aesthetic understanding to provide appropriate instructions for adjusting image quality and camera parameters. However, this paradigm relies on explicit human instruction of aesthetic intent, which is often ambiguous, incomplete, or inaccessible to non-expert users. In this work, we propose SmartPhotoCrafter, an automatic photographic image editing method which formulates image editing as a tightly coupled reasoning-to-generation process. The proposed model first performs image quality comprehension and identifies deficiencies by the Image Critic module, and then the Photographic Artist module realizes targeted edits to enhance image appeal, eliminating the need for explicit human instructions. A multi-stage training pipeline is adopted: (i) Foundation pretraining to establish basic aesthetic understanding and editing capabilities, (ii) Adaptation with reasoning-guided multi-edit supervision to incorporate rich semantic guidance, and (iii) Coordinated reasoning-to generation reinforcement learning to jointly optimize reasoning and generation. During training, SmartPhotoCrafter emphasizes photo-realistic image generation, while supporting both image restoration and retouching tasks with consistent adherence to color- and tone-related semantics. We also construct a stage-specific dataset, which progressively builds reasoning and controllable generation, effective cross-module collaboration, and ultimately high-quality photographic enhancement. Experiments demonstrate that SmartPhotoCrafter outperforms existing generative models on the task of automatic photographic enhancement, achieving photo-realistic results while exhibiting higher tonal sensitivity to retouching instructions. Project page: https://github.com/vivoCameraResearch/SmartPhotoCrafter.
PDF50April 23, 2026