Make-It-Poseable: Ein vorwärtsgerichtetes latentes Posing-Modell für die Animation von 3D-Humanoid-Charakteren
Make-It-Poseable: Feed-forward Latent Posing Model for 3D Humanoid Character Animation
December 18, 2025
papers.authors: Zhiyang Guo, Ori Zhang, Jax Xiang, Alan Zhao, Wengang Zhou, Houqiang Li
cs.AI
papers.abstract
Das Posieren von 3D-Charakteren ist eine grundlegende Aufgabe in der Computergrafik und Computer Vision. Bisherige Methoden wie Auto-Rigging und posesensitive Generierung stoßen jedoch oft auf Herausforderungen wie ungenaue Vorhersage der Skinning-Gewichte, topologische Unzulänglichkeiten und mangelnde Pose-Konformität, was ihre Robustheit und Generalisierbarkeit einschränkt. Um diese Grenzen zu überwinden, stellen wir Make-It-Poseable vor, ein neuartiges Feedforward-System, das das Charakter-Posieren als ein Latent-Space-Transformationsproblem neu formuliert. Anstatt Mesh-Vertices wie in traditionellen Pipelines zu verformen, rekonstruiert unsere Methode den Charakter in neuen Posen durch direkte Manipulation seiner latenten Repräsentation. Kernstück unserer Methode ist ein latenter Posing-Transformer, der Shape-Tokens basierend auf Skelettbewegungen manipuliert. Dieser Prozess wird durch eine dichte Poserepräsentation für präzise Steuerung ermöglicht. Um hochwertige Geometrie zu gewährleisten und topologische Veränderungen zu berücksichtigen, führen wir außerdem eine Latent-Space-Überwachungsstrategie und ein adaptives Vervollständigungsmodul ein. Unsere Methode zeigt eine überlegene Leistung in der Posing-Qualität. Sie erstreckt sich natürlich auch auf 3D-Bearbeitungsanwendungen wie Teileaustausch und -verfeinerung.
English
Posing 3D characters is a fundamental task in computer graphics and vision. However, existing methods like auto-rigging and pose-conditioned generation often struggle with challenges such as inaccurate skinning weight prediction, topological imperfections, and poor pose conformance, limiting their robustness and generalizability. To overcome these limitations, we introduce Make-It-Poseable, a novel feed-forward framework that reformulates character posing as a latent-space transformation problem. Instead of deforming mesh vertices as in traditional pipelines, our method reconstructs the character in new poses by directly manipulating its latent representation. At the core of our method is a latent posing transformer that manipulates shape tokens based on skeletal motion. This process is facilitated by a dense pose representation for precise control. To ensure high-fidelity geometry and accommodate topological changes, we also introduce a latent-space supervision strategy and an adaptive completion module. Our method demonstrates superior performance in posing quality. It also naturally extends to 3D editing applications like part replacement and refinement.