ATLAS: Desacoplamento de Parâmetros Esqueléticos e de Forma para Modelagem Humana Paramétrica Expressiva
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling
August 21, 2025
Autores: Jinhyung Park, Javier Romero, Shunsuke Saito, Fabian Prada, Takaaki Shiratori, Yichen Xu, Federica Bogo, Shoou-I Yu, Kris Kitani, Rawal Khirodkar
cs.AI
Resumo
Modelos corporais paramétricos oferecem uma representação 3D expressiva de humanos em uma ampla gama de poses, formas e expressões faciais, tipicamente derivada da aprendizagem de uma base sobre malhas 3D registradas. No entanto, as abordagens existentes de modelagem de malhas humanas lutam para capturar variações detalhadas em diversas poses e formas corporais, em grande parte devido à diversidade limitada dos dados de treinamento e a suposições de modelagem restritivas. Além disso, o paradigma comum primeiro otimiza a superfície externa do corpo usando uma base linear, e então regride as articulações esqueléticas internas a partir dos vértices da superfície. Essa abordagem introduz dependências problemáticas entre o esqueleto interno e o tecido mole externo, limitando o controle direto sobre a altura do corpo e os comprimentos dos ossos. Para resolver esses problemas, apresentamos o ATLAS, um modelo corporal de alta fidelidade aprendido a partir de 600 mil varreduras de alta resolução capturadas usando 240 câmeras sincronizadas. Diferente de métodos anteriores, explicitamente desacoplamos as bases de forma e esqueleto ao fundamentar nossa representação de malha no esqueleto humano. Esse desacoplamento permite uma expressividade de forma aprimorada, personalização refinada de atributos corporais e ajuste de pontos-chave independente das características do tecido mole externo. O ATLAS supera os métodos existentes ao ajustar sujeitos não vistos em diversas poses com maior precisão, e avaliações quantitativas mostram que nossas correções de pose não lineares capturam poses complexas de forma mais eficaz em comparação com modelos lineares.
English
Parametric body models offer expressive 3D representation of humans across a
wide range of poses, shapes, and facial expressions, typically derived by
learning a basis over registered 3D meshes. However, existing human mesh
modeling approaches struggle to capture detailed variations across diverse body
poses and shapes, largely due to limited training data diversity and
restrictive modeling assumptions. Moreover, the common paradigm first optimizes
the external body surface using a linear basis, then regresses internal
skeletal joints from surface vertices. This approach introduces problematic
dependencies between internal skeleton and outer soft tissue, limiting direct
control over body height and bone lengths. To address these issues, we present
ATLAS, a high-fidelity body model learned from 600k high-resolution scans
captured using 240 synchronized cameras. Unlike previous methods, we explicitly
decouple the shape and skeleton bases by grounding our mesh representation in
the human skeleton. This decoupling enables enhanced shape expressivity,
fine-grained customization of body attributes, and keypoint fitting independent
of external soft-tissue characteristics. ATLAS outperforms existing methods by
fitting unseen subjects in diverse poses more accurately, and quantitative
evaluations show that our non-linear pose correctives more effectively capture
complex poses compared to linear models.