ChatPaper.aiChatPaper

HiFi-Inpaint: 디테일 보존이 가능한 인간-제품 이미지 생성을 위한 고품질 참조 기반 인페인팅 기술

HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images

March 2, 2026
저자: Yichen Liu, Donghao Zhou, Jie Wang, Xin Gao, Guisheng Liu, Jiatong Li, Quanwei Zhang, Qiang Lyu, Lanqing Guo, Shilei Wen, Weiqiang Wang, Pheng-Ann Heng
cs.AI

초록

인간과 제품의 통합을 보여주는 인간-제품 이미지는 광고, 전자상거래, 디지털 마케팅에서 핵심적인 역할을 합니다. 이러한 이미지 생성의 핵심 과제는 제품 디테일의 높은 정확도 보존을 보장하는 데 있습니다. 기존 패러다임 중 참조 기반 인페인팅은 제품 참조 이미지를 활용하여 인페인팅 과정을 안내하는 표적 솔루션을 제공합니다. 그러나 세 가지 주요 측면에서 한계가 남아있습니다: 다양한 대규모 훈련 데이터 부족, 기존 모델의 제품 디테일 보존에 집중하는 데 어려움, 정밀한 안내를 달성하기 위한 세밀한 감독의 부재 등입니다. 이러한 문제를 해결하기 위해 우리는 인간-제품 이미지 생성을 위해 특화된 새로운 고정밀 참조 기반 인페인팅 프레임워크인 HiFi-Inpaint를 제안합니다. HiFi-Inpaint는 미세한 수준의 제품 특징을 개선하기 위한 공유 향상 어텐션(SEA)과 고주파수 맵을 사용한 정밀한 픽셀 수준 감독을 강화하기 위한 디테일 인식 손실(DAL)을 도입합니다. 또한 자체 합성 데이터에서 선별하고 자동 필터링으로 처리된 샘플로 구성된 새로운 데이터셋인 HP-Image-40K를 구축했습니다. 실험 결과, HiFi-Inpaint가 최첨단 성능을 달성하며 디테일 보존형 인간-제품 이미지를 제공함을 보여줍니다.
English
Human-product images, which showcase the integration of humans and products, play a vital role in advertising, e-commerce, and digital marketing. The essential challenge of generating such images lies in ensuring the high-fidelity preservation of product details. Among existing paradigms, reference-based inpainting offers a targeted solution by leveraging product reference images to guide the inpainting process. However, limitations remain in three key aspects: the lack of diverse large-scale training data, the struggle of current models to focus on product detail preservation, and the inability of coarse supervision for achieving precise guidance. To address these issues, we propose HiFi-Inpaint, a novel high-fidelity reference-based inpainting framework tailored for generating human-product images. HiFi-Inpaint introduces Shared Enhancement Attention (SEA) to refine fine-grained product features and Detail-Aware Loss (DAL) to enforce precise pixel-level supervision using high-frequency maps. Additionally, we construct a new dataset, HP-Image-40K, with samples curated from self-synthesis data and processed with automatic filtering. Experimental results show that HiFi-Inpaint achieves state-of-the-art performance, delivering detail-preserving human-product images.
PDF262March 9, 2026