ChatPaper.aiChatPaper

HiFi-Inpaint:高精細な参照ベース画像修復によるディテール保持型人物・製品画像生成へのアプローチ

HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images

March 2, 2026
著者: Yichen Liu, Donghao Zhou, Jie Wang, Xin Gao, Guisheng Liu, Jiatong Li, Quanwei Zhang, Qiang Lyu, Lanqing Guo, Shilei Wen, Weiqiang Wang, Pheng-Ann Heng
cs.AI

要旨

人間と製品の統合を表現するヒューマン・プロダクト画像は、広告、Eコマース、デジタルマーケティングにおいて重要な役割を果たしている。このような画像生成における本質的な課題は、製品ディテールの高精度な保存を保証することにある。既存のパラダイムの中でも、参照画像に基づくインペインティングは、製品参照画像を活用して修復プロセスを導出する標的型ソリューションを提供する。しかし、(1)多様な大規模トレーニングデータの不足、(2)現行モデルが製品ディテール保存に集中する困難さ、(3)精密な指導を達成するための粗い監督の不可能性、という3つの重要な側面で制約が残っている。これらの課題に対処するため、我々はヒューマン・プロダクト画像生成に特化した新しい高精度参照ベースインペインティングフレームワーク「HiFi-Inpaint」を提案する。HiFi-Inpaintは、微細な製品特徴を洗練する共有強化注意機構(SEA)と、高周波数マップを用いたピクセルレベルの精密な監督を実施するディテール認識損失(DAL)を導入する。さらに、自己合成データから精選し自動フィルタリング処理を施した新しいデータセット「HP-Image-40K」を構築した。実験結果では、HiFi-Inpaintが最先端の性能を達成し、ディテール保存性に優れたヒューマン・プロダクト画像を生成できることを示している。
English
Human-product images, which showcase the integration of humans and products, play a vital role in advertising, e-commerce, and digital marketing. The essential challenge of generating such images lies in ensuring the high-fidelity preservation of product details. Among existing paradigms, reference-based inpainting offers a targeted solution by leveraging product reference images to guide the inpainting process. However, limitations remain in three key aspects: the lack of diverse large-scale training data, the struggle of current models to focus on product detail preservation, and the inability of coarse supervision for achieving precise guidance. To address these issues, we propose HiFi-Inpaint, a novel high-fidelity reference-based inpainting framework tailored for generating human-product images. HiFi-Inpaint introduces Shared Enhancement Attention (SEA) to refine fine-grained product features and Detail-Aware Loss (DAL) to enforce precise pixel-level supervision using high-frequency maps. Additionally, we construct a new dataset, HP-Image-40K, with samples curated from self-synthesis data and processed with automatic filtering. Experimental results show that HiFi-Inpaint achieves state-of-the-art performance, delivering detail-preserving human-product images.
PDF262March 9, 2026