ChatPaper.aiChatPaper

Alterbute: 画像内オブジェクトの本質的属性編集

Alterbute: Editing Intrinsic Attributes of Objects in Images

January 15, 2026
著者: Tal Reiss, Daniel Winter, Matan Cohen, Alex Rav-Acha, Yael Pritch, Ariel Shamir, Yedid Hoshen
cs.AI

要旨

本論文では、画像内のオブジェクトの本質的属性を編集する拡散ベースの手法「Alterbute」を提案する。本手法では、オブジェクトの知覚的アイデンティティとシーンコンテキストを保持しつつ、色、テクスチャ、材質、さらには形状の変更を可能とする。既存手法は、アイデンティティの保持に失敗しがちな教師なし事前分布に依存するか、意味のある本質的変化を妨げる過度に制限的な教師信号を用いるかのいずれかである。我々の手法は以下に基づく:(i) アイデンティティ参照画像、目標の本質的属性を記述するテキストプロンプト、および外的コンテキストを定義する背景画像とオブジェクトマスクを条件として、モデルが本質的・外的属性の両方を変更できる緩やかな訓練目的。推論時には、元の背景とオブジェクトマスクを再利用して外的変化を制限し、目的の本質的属性のみが変更されることを保証する。(ii) Visual Named Entities(VNE)―アイデンティティを定義する特徴を共有しつつ本質的属性にばらつきのあるオブジェクトをグループ化する、細粒度の視覚的アイデンティティカテゴリ(例:「ポルシェ911カレラ」)。大規模公開画像データセットから視覚言語モデルを用いてVNEラベルと本質的属性記述を自動抽出し、スケーラブルでアイデンティティ保持性のある教師信号を実現する。Alterbuteは、アイデンティティを保持するオブジェクト本質的属性編集において既存手法を凌駕する。
English
We introduce Alterbute, a diffusion-based method for editing an object's intrinsic attributes in an image. We allow changing color, texture, material, and even the shape of an object, while preserving its perceived identity and scene context. Existing approaches either rely on unsupervised priors that often fail to preserve identity or use overly restrictive supervision that prevents meaningful intrinsic variations. Our method relies on: (i) a relaxed training objective that allows the model to change both intrinsic and extrinsic attributes conditioned on an identity reference image, a textual prompt describing the target intrinsic attributes, and a background image and object mask defining the extrinsic context. At inference, we restrict extrinsic changes by reusing the original background and object mask, thereby ensuring that only the desired intrinsic attributes are altered; (ii) Visual Named Entities (VNEs) - fine-grained visual identity categories (e.g., ''Porsche 911 Carrera'') that group objects sharing identity-defining features while allowing variation in intrinsic attributes. We use a vision-language model to automatically extract VNE labels and intrinsic attribute descriptions from a large public image dataset, enabling scalable, identity-preserving supervision. Alterbute outperforms existing methods on identity-preserving object intrinsic attribute editing.
PDF181January 17, 2026