ChatPaper.aiChatPaper

絶対座標はモーション生成を容易にする

Absolute Coordinates Make Motion Generation Easy

May 26, 2025
著者: Zichong Meng, Zeyu Han, Xiaogang Peng, Yiming Xie, Huaizu Jiang
cs.AI

要旨

最先端のテキストからモーション生成モデルは、HumanML3Dによって普及したキネマティクスを考慮した局所相対モーション表現に依存しています。これは、骨盤と前フレームに対する相対的なモーションを組み込みの冗長性とともにエンコードするものです。この設計は初期の生成モデルのトレーニングを簡素化しますが、拡散モデルにとって重要な制限を導入し、下流タスクへの適用性を妨げます。本研究では、モーション表現を再検討し、テキストからモーション生成のための根本的に簡素化され、長らく放棄されていた代替案を提案します:グローバル空間における絶対関節座標です。設計選択の体系的な分析を通じて、この定式化が、単純なTransformerバックボーンと補助的なキネマティクスを考慮した損失なしでも、大幅に高いモーション忠実度、改善されたテキストアラインメント、および強力なスケーラビリティを達成することを示します。さらに、この定式化は、追加のタスク固有の再設計や制御信号からの高コストな分類器ガイダンス生成なしで、テキスト駆動のモーション制御や時間的/空間的編集などの下流タスクを自然にサポートします。最後に、テキストから直接SMPL-Hメッシュ頂点をモーションとして生成する有望な一般化を示し、将来の研究とモーション関連アプリケーションのための強固な基盤を築きます。
English
State-of-the-art text-to-motion generation models rely on the kinematic-aware, local-relative motion representation popularized by HumanML3D, which encodes motion relative to the pelvis and to the previous frame with built-in redundancy. While this design simplifies training for earlier generation models, it introduces critical limitations for diffusion models and hinders applicability to downstream tasks. In this work, we revisit the motion representation and propose a radically simplified and long-abandoned alternative for text-to-motion generation: absolute joint coordinates in global space. Through systematic analysis of design choices, we show that this formulation achieves significantly higher motion fidelity, improved text alignment, and strong scalability, even with a simple Transformer backbone and no auxiliary kinematic-aware losses. Moreover, our formulation naturally supports downstream tasks such as text-driven motion control and temporal/spatial editing without additional task-specific reengineering and costly classifier guidance generation from control signals. Finally, we demonstrate promising generalization to directly generate SMPL-H mesh vertices in motion from text, laying a strong foundation for future research and motion-related applications.

Summary

AI-Generated Summary

PDF12May 28, 2025