ATLAS: Disaccoppiamento dei parametri scheletrici e di forma per la modellazione parametrica umana espressiva
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling
August 21, 2025
Autori: Jinhyung Park, Javier Romero, Shunsuke Saito, Fabian Prada, Takaaki Shiratori, Yichen Xu, Federica Bogo, Shoou-I Yu, Kris Kitani, Rawal Khirodkar
cs.AI
Abstract
I modelli parametrici del corpo offrono una rappresentazione 3D espressiva degli esseri umani in un'ampia gamma di pose, forme ed espressioni facciali, tipicamente derivata dall'apprendimento di una base su mesh 3D registrate. Tuttavia, gli approcci esistenti per la modellazione delle mesh umane faticano a catturare variazioni dettagliate tra diverse pose e forme del corpo, principalmente a causa della limitata diversità dei dati di addestramento e di ipotesi di modellazione restrittive. Inoltre, il paradigma comune ottimizza prima la superficie esterna del corpo utilizzando una base lineare, per poi regredire le articolazioni scheletriche interne dai vertici della superficie. Questo approccio introduce problematiche dipendenze tra lo scheletro interno e i tessuti molli esterni, limitando il controllo diretto sull'altezza del corpo e sulla lunghezza delle ossa. Per affrontare questi problemi, presentiamo ATLAS, un modello corporeo ad alta fedeltà appreso da 600k scansioni ad alta risoluzione acquisite utilizzando 240 telecamere sincronizzate. A differenza dei metodi precedenti, disaccoppiamo esplicitamente le basi della forma e dello scheletro ancorando la nostra rappresentazione mesh allo scheletro umano. Questo disaccoppiamento consente una maggiore espressività della forma, una personalizzazione fine degli attributi corporei e un adattamento dei punti chiave indipendente dalle caratteristiche dei tessuti molli esterni. ATLAS supera i metodi esistenti adattando soggetti non visti in pose diverse con maggiore precisione, e le valutazioni quantitative dimostrano che le nostre correzioni di pose non lineari catturano le pose complesse in modo più efficace rispetto ai modelli lineari.
English
Parametric body models offer expressive 3D representation of humans across a
wide range of poses, shapes, and facial expressions, typically derived by
learning a basis over registered 3D meshes. However, existing human mesh
modeling approaches struggle to capture detailed variations across diverse body
poses and shapes, largely due to limited training data diversity and
restrictive modeling assumptions. Moreover, the common paradigm first optimizes
the external body surface using a linear basis, then regresses internal
skeletal joints from surface vertices. This approach introduces problematic
dependencies between internal skeleton and outer soft tissue, limiting direct
control over body height and bone lengths. To address these issues, we present
ATLAS, a high-fidelity body model learned from 600k high-resolution scans
captured using 240 synchronized cameras. Unlike previous methods, we explicitly
decouple the shape and skeleton bases by grounding our mesh representation in
the human skeleton. This decoupling enables enhanced shape expressivity,
fine-grained customization of body attributes, and keypoint fitting independent
of external soft-tissue characteristics. ATLAS outperforms existing methods by
fitting unseen subjects in diverse poses more accurately, and quantitative
evaluations show that our non-linear pose correctives more effectively capture
complex poses compared to linear models.