ChatPaper.aiChatPaper

WildActor: 制約のないアイデンティティ保存型ビデオ生成

WildActor: Unconstrained Identity-Preserving Video Generation

February 28, 2026
著者: Qin Guo, Tianyu Yang, Xuanhua He, Fei Shen, Yong Zhang, Zhuoliang Kang, Xiaoming Wei, Dan Xu
cs.AI

要旨

実用的な人間映像生成には、デジタルアクターが動的なショット、視点、動作にわたって厳密に一貫した全身の同一性を維持することが必要ですが、この設定は既存手法にとって依然として困難な課題です。従来手法は、身体レベルの一貫性を軽視した顔中心の動作に陥りやすいか、ポーズ固定により被写体が硬直したコピー&ペーストの不自然さを生じる傾向があります。本稿では、制約のない視点と環境下での同一性一貫性を捉えるために設計された大規模人間映像データセットActor-18Mを提案します。Actor-18Mは、任意視点と正準三面図表現の両方を網羅する160万の映像と1800万の対応する人間画像で構成されています。Actor-18Mを活用し、任意視点条件付き人間映像生成のためのフレームワークWildActorを提案します。境界適応型モンテカルロサンプリング戦略と結合した非対称同一性保持注意機構を導入し、参照条件を限界効用に基づいて反復的に再重み付けすることで、均衡のとれた多様体カバレッジを実現します。提案するActor-Benchによる評価では、WildActorは多様なショット構成、大きな視点遷移、大幅な動作下においても身体の同一性を一貫して保持し、これらの困難な設定において既存手法を凌駕する結果を示しました。
English
Production-ready human video generation requires digital actors to maintain strictly consistent full-body identities across dynamic shots, viewpoints and motions, a setting that remains challenging for existing methods. Prior methods often suffer from face-centric behavior that neglects body-level consistency, or produce copy-paste artifacts where subjects appear rigid due to pose locking. We present Actor-18M, a large-scale human video dataset designed to capture identity consistency under unconstrained viewpoints and environments. Actor-18M comprises 1.6M videos with 18M corresponding human images, covering both arbitrary views and canonical three-view representations. Leveraging Actor-18M, we propose WildActor, a framework for any-view conditioned human video generation. We introduce an Asymmetric Identity-Preserving Attention mechanism coupled with a Viewpoint-Adaptive Monte Carlo Sampling strategy that iteratively re-weights reference conditions by marginal utility for balanced manifold coverage. Evaluated on the proposed Actor-Bench, WildActor consistently preserves body identity under diverse shot compositions, large viewpoint transitions, and substantial motions, surpassing existing methods in these challenging settings.
PDF385May 8, 2026