ATLAS: Разделение параметров скелета и формы для выразительного параметрического моделирования человека
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling
August 21, 2025
Авторы: Jinhyung Park, Javier Romero, Shunsuke Saito, Fabian Prada, Takaaki Shiratori, Yichen Xu, Federica Bogo, Shoou-I Yu, Kris Kitani, Rawal Khirodkar
cs.AI
Аннотация
Параметрические модели тела предоставляют выразительные 3D-представления человека в широком диапазоне поз, форм и мимики, обычно получаемые путем обучения базиса на зарегистрированных 3D-сетках. Однако существующие подходы к моделированию человеческого меша сталкиваются с трудностями в захвате детальных вариаций для разнообразных поз и форм тела, что во многом обусловлено ограниченным разнообразием обучающих данных и строгими предположениями моделирования. Более того, распространенная парадигма сначала оптимизирует внешнюю поверхность тела с использованием линейного базиса, а затем регрессирует внутренние скелетные суставы из вершин поверхности. Такой подход создает проблемные зависимости между внутренним скелетом и внешними мягкими тканями, ограничивая прямой контроль над ростом тела и длиной костей. Для решения этих проблем мы представляем ATLAS — высокоточную модель тела, обученную на 600 тыс. высококачественных сканов, полученных с использованием 240 синхронизированных камер. В отличие от предыдущих методов, мы явно разделяем базисы формы и скелета, основывая наше представление меша на человеческом скелете. Это разделение позволяет повысить выразительность формы, тонкую настройку атрибутов тела и подгонку ключевых точек независимо от характеристик внешних мягких тканей. ATLAS превосходит существующие методы, более точно подгоняя неизвестные объекты в разнообразных позах, а количественные оценки показывают, что наши нелинейные коррективы поз эффективнее захватывают сложные позы по сравнению с линейными моделями.
English
Parametric body models offer expressive 3D representation of humans across a
wide range of poses, shapes, and facial expressions, typically derived by
learning a basis over registered 3D meshes. However, existing human mesh
modeling approaches struggle to capture detailed variations across diverse body
poses and shapes, largely due to limited training data diversity and
restrictive modeling assumptions. Moreover, the common paradigm first optimizes
the external body surface using a linear basis, then regresses internal
skeletal joints from surface vertices. This approach introduces problematic
dependencies between internal skeleton and outer soft tissue, limiting direct
control over body height and bone lengths. To address these issues, we present
ATLAS, a high-fidelity body model learned from 600k high-resolution scans
captured using 240 synchronized cameras. Unlike previous methods, we explicitly
decouple the shape and skeleton bases by grounding our mesh representation in
the human skeleton. This decoupling enables enhanced shape expressivity,
fine-grained customization of body attributes, and keypoint fitting independent
of external soft-tissue characteristics. ATLAS outperforms existing methods by
fitting unseen subjects in diverse poses more accurately, and quantitative
evaluations show that our non-linear pose correctives more effectively capture
complex poses compared to linear models.