SMPLify Aprendible: Una Solución Neuronal para Cinemática Inversa de Posturas Humanas sin Optimización
Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics
August 19, 2025
Autores: Yuchen Yang, Linfeng Dong, Wei Wang, Zhihang Zhong, Xiao Sun
cs.AI
Resumen
En la estimación de pose y forma humana en 3D, SMPLify sigue siendo una línea de base robusta que resuelve la cinemática inversa (IK) mediante optimización iterativa. Sin embargo, su alto costo computacional limita su practicidad. Avances recientes en diversos dominios han demostrado que reemplazar la optimización iterativa con redes neuronales basadas en datos puede lograr mejoras significativas en el tiempo de ejecución sin sacrificar precisión. Motivados por esta tendencia, proponemos Learnable SMPLify, un marco neuronal que reemplaza el proceso de ajuste iterativo en SMPLify con un modelo de regresión de una sola pasada. El diseño de nuestro marco aborda dos desafíos centrales en la IK neuronal: la construcción de datos y la generalización. Para permitir un entrenamiento efectivo, proponemos una estrategia de muestreo temporal que construye pares de inicialización-objetivo a partir de marcos secuenciales. Para mejorar la generalización en diversos movimientos y poses no vistas, proponemos un esquema de normalización centrado en el humano y aprendizaje residual para reducir el espacio de soluciones. Learnable SMPLify admite tanto inferencia secuencial como post-procesamiento plug-in para refinar estimadores basados en imágenes existentes. Experimentos extensivos demuestran que nuestro método se establece como una línea de base práctica y simple: logra un tiempo de ejecución casi 200 veces más rápido en comparación con SMPLify, generaliza bien a 3DPW y RICH no vistos, y opera de manera agnóstica al modelo cuando se utiliza como una herramienta plug-in en LucidAction. El código está disponible en https://github.com/Charrrrrlie/Learnable-SMPLify.
English
In 3D human pose and shape estimation, SMPLify remains a robust baseline that
solves inverse kinematics (IK) through iterative optimization. However, its
high computational cost limits its practicality. Recent advances across domains
have shown that replacing iterative optimization with data-driven neural
networks can achieve significant runtime improvements without sacrificing
accuracy. Motivated by this trend, we propose Learnable SMPLify, a neural
framework that replaces the iterative fitting process in SMPLify with a
single-pass regression model. The design of our framework targets two core
challenges in neural IK: data construction and generalization. To enable
effective training, we propose a temporal sampling strategy that constructs
initialization-target pairs from sequential frames. To improve generalization
across diverse motions and unseen poses, we propose a human-centric
normalization scheme and residual learning to narrow the solution space.
Learnable SMPLify supports both sequential inference and plug-in
post-processing to refine existing image-based estimators. Extensive
experiments demonstrate that our method establishes itself as a practical and
simple baseline: it achieves nearly 200x faster runtime compared to SMPLify,
generalizes well to unseen 3DPW and RICH, and operates in a model-agnostic
manner when used as a plug-in tool on LucidAction. The code is available at
https://github.com/Charrrrrlie/Learnable-SMPLify.