ChatPaper.aiChatPaper

SMPLify Apprenable : Une Solution Neuronale pour la Cinématique Inverse de la Pose Humaine Sans Optimisation

Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics

August 19, 2025
papers.authors: Yuchen Yang, Linfeng Dong, Wei Wang, Zhihang Zhong, Xiao Sun
cs.AI

papers.abstract

Dans l'estimation de la pose et de la forme humaine en 3D, SMPLify reste une référence robuste qui résout la cinématique inverse (IK) par optimisation itérative. Cependant, son coût computationnel élevé limite son utilité pratique. Les avancées récentes dans divers domaines ont montré que remplacer l'optimisation itérative par des réseaux de neurones pilotés par les données permet d'obtenir des gains significatifs en temps d'exécution sans sacrifier la précision. Motivés par cette tendance, nous proposons Learnable SMPLify, un cadre neuronal qui remplace le processus d'ajustement itératif de SMPLify par un modèle de régression en une seule passe. La conception de notre cadre cible deux défis majeurs dans l'IK neuronale : la construction des données et la généralisation. Pour permettre un entraînement efficace, nous proposons une stratégie d'échantillonnage temporel qui construit des paires d'initialisation-cible à partir de séquences d'images. Pour améliorer la généralisation à travers des mouvements divers et des poses inédites, nous proposons un schéma de normalisation centré sur l'humain et un apprentissage résiduel pour réduire l'espace des solutions. Learnable SMPLify prend en charge à la fois l'inférence séquentielle et le post-traitement en tant que module complémentaire pour affiner les estimateurs basés sur l'image existants. Des expériences approfondies démontrent que notre méthode s'impose comme une référence pratique et simple : elle atteint un temps d'exécution près de 200 fois plus rapide que SMPLify, généralise bien aux ensembles 3DPW et RICH inédits, et fonctionne de manière agnostique au modèle lorsqu'elle est utilisée comme outil complémentaire sur LucidAction. Le code est disponible à l'adresse https://github.com/Charrrrrlie/Learnable-SMPLify.
English
In 3D human pose and shape estimation, SMPLify remains a robust baseline that solves inverse kinematics (IK) through iterative optimization. However, its high computational cost limits its practicality. Recent advances across domains have shown that replacing iterative optimization with data-driven neural networks can achieve significant runtime improvements without sacrificing accuracy. Motivated by this trend, we propose Learnable SMPLify, a neural framework that replaces the iterative fitting process in SMPLify with a single-pass regression model. The design of our framework targets two core challenges in neural IK: data construction and generalization. To enable effective training, we propose a temporal sampling strategy that constructs initialization-target pairs from sequential frames. To improve generalization across diverse motions and unseen poses, we propose a human-centric normalization scheme and residual learning to narrow the solution space. Learnable SMPLify supports both sequential inference and plug-in post-processing to refine existing image-based estimators. Extensive experiments demonstrate that our method establishes itself as a practical and simple baseline: it achieves nearly 200x faster runtime compared to SMPLify, generalizes well to unseen 3DPW and RICH, and operates in a model-agnostic manner when used as a plug-in tool on LucidAction. The code is available at https://github.com/Charrrrrlie/Learnable-SMPLify.
PDF12August 25, 2025