SMPLify Aprendible: Una Solución Neuronal para Cinemática Inversa de Posturas Humanas sin Optimización

Resumen

En la estimación de pose y forma humana en 3D, SMPLify sigue siendo una línea de base robusta que resuelve la cinemática inversa (IK) mediante optimización iterativa. Sin embargo, su alto costo computacional limita su practicidad. Avances recientes en diversos dominios han demostrado que reemplazar la optimización iterativa con redes neuronales basadas en datos puede lograr mejoras significativas en el tiempo de ejecución sin sacrificar precisión. Motivados por esta tendencia, proponemos Learnable SMPLify, un marco neuronal que reemplaza el proceso de ajuste iterativo en SMPLify con un modelo de regresión de una sola pasada. El diseño de nuestro marco aborda dos desafíos centrales en la IK neuronal: la construcción de datos y la generalización. Para permitir un entrenamiento efectivo, proponemos una estrategia de muestreo temporal que construye pares de inicialización-objetivo a partir de marcos secuenciales. Para mejorar la generalización en diversos movimientos y poses no vistas, proponemos un esquema de normalización centrado en el humano y aprendizaje residual para reducir el espacio de soluciones. Learnable SMPLify admite tanto inferencia secuencial como post-procesamiento plug-in para refinar estimadores basados en imágenes existentes. Experimentos extensivos demuestran que nuestro método se establece como una línea de base práctica y simple: logra un tiempo de ejecución casi 200 veces más rápido en comparación con SMPLify, generaliza bien a 3DPW y RICH no vistos, y opera de manera agnóstica al modelo cuando se utiliza como una herramienta plug-in en LucidAction. El código está disponible en https://github.com/Charrrrrlie/Learnable-SMPLify.

English

In 3D human pose and shape estimation, SMPLify remains a robust baseline that solves inverse kinematics (IK) through iterative optimization. However, its high computational cost limits its practicality. Recent advances across domains have shown that replacing iterative optimization with data-driven neural networks can achieve significant runtime improvements without sacrificing accuracy. Motivated by this trend, we propose Learnable SMPLify, a neural framework that replaces the iterative fitting process in SMPLify with a single-pass regression model. The design of our framework targets two core challenges in neural IK: data construction and generalization. To enable effective training, we propose a temporal sampling strategy that constructs initialization-target pairs from sequential frames. To improve generalization across diverse motions and unseen poses, we propose a human-centric normalization scheme and residual learning to narrow the solution space. Learnable SMPLify supports both sequential inference and plug-in post-processing to refine existing image-based estimators. Extensive experiments demonstrate that our method establishes itself as a practical and simple baseline: it achieves nearly 200x faster runtime compared to SMPLify, generalizes well to unseen 3DPW and RICH, and operates in a model-agnostic manner when used as a plug-in tool on LucidAction. The code is available at https://github.com/Charrrrrlie/Learnable-SMPLify.

SMPLify Aprendible: Una Solución Neuronal para Cinemática Inversa de Posturas Humanas sin Optimización

Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics

Resumen

Support