EditCrafter: 사전 학습된 확산 모델을 통한 튜닝 프리 고해상도 이미지 편집
EditCrafter: Tuning-free High-Resolution Image Editing via Pretrained Diffusion Model
April 11, 2026
저자: Kunho Kim, Sumin Seo, Yongjun Cho, Hyungjin Chung
cs.AI
초록
EditCrafter는 사전 학습된 텍스트-이미지(T2I) 확산 모델을 활용하여 훈련 시 사용된 해상도를 크게 초과하는 해상도에서 이미지를 처리하는 튜닝 없이 동작하는 고해상도 이미지 편집 방법을 제안합니다. 대규모 T2I 확산 모델의 생성 사전 지식을 활용하면 다양한 새로운 생성 및 편집 애플리케이션 개발이 가능해집니다. 확산 모델 기반의 수많은 이미지 편집 방법이 제안되어 높은 품질의 편집 결과를 보여주지만, 이들은 훈련 해상도(512x512 또는 1024x1024)에서만 작동하므로 임의의 종횡비나 더 높은 해상도의 이미지에 적용하기 어렵습니다. 패치 단위 편집을 단순하게 적용하면 비현실적인 객체 구조와 반복이 발생합니다. 이러한 문제를 해결하기 위해 간단하면서도 효과적인 편집 파이프라인인 EditCrafter를 소개합니다. EditCrafter는 먼저 타일 방식 인버전을 수행하여 입력 고해상도 이미지의 원본 정체성을 보존합니다. 또한 인버전된 잠재 공간에서 고해상도 이미지 편집에 맞춤화된 노이즈 감쇠 매니폴드 제약 classifier-free guidance(NDCFG++)를 추가로 제안합니다. 우리의 실험 결과, 제안하는 EditCrafter는 파인튜닝이나 최적화 없이도 다양한 해상도에서 인상적인 편집 결과를 달성할 수 있음을 보여줍니다.
English
We propose EditCrafter, a high-resolution image editing method that operates without tuning, leveraging pretrained text-to-image (T2I) diffusion models to process images at resolutions significantly exceeding those used during training. Leveraging the generative priors of large-scale T2I diffusion models enables the development of a wide array of novel generation and editing applications. Although numerous image editing methods have been proposed based on diffusion models and exhibit high-quality editing results, they are difficult to apply to images with arbitrary aspect ratios or higher resolutions since they only work at the training resolutions (512x512 or 1024x1024). Naively applying patch-wise editing fails with unrealistic object structures and repetition. To address these challenges, we introduce EditCrafter, a simple yet effective editing pipeline. EditCrafter operates by first performing tiled inversion, which preserves the original identity of the input high-resolution image. We further propose a noise-damped manifold-constrained classifier-free guidance (NDCFG++) that is tailored for high resolution image editing from the inverted latent. Our experiments show that the our EditCrafter can achieve impressive editing results across various resolutions without fine-tuning and optimization.