ChatPaper.aiChatPaper

¿Pueden existir dinámicas predichas en el mundo físico?

Can Predicted Dynamics Exist in the Physical World?

May 23, 2026
Autores: Barak Or
cs.AI

Resumen

Los sistemas de IA Física Predictiva generan despliegues de estado, fragmentos de acción y planes latentes, sin embargo, un error cuadrático medio bajo (RMSE) no implica que una propuesta particular sea físicamente ejecutable. Formulamos la admisibilidad física como una interfaz de predicción-control: antes de la ejecución, una propuesta decodificada se trata como dinámica candidata y se evalúa utilizando condiciones cinemáticas, dinámicas y de horizonte directo a compuesto. Superar la evaluación no es un certificado de éxito de la tarea; el rechazo identifica una violación del entorno físico especificado y proporciona una razón a nivel de componente. En Hugging Face LeRobot PushT, la falsificación controlada muestra que el RMSE de predicción de un solo paso y los residuos de dinámica estandarizados alcanzan un área bajo la curva de característica operativa del receptor (AUC) de 0.982 y 0.972, las condiciones solo cinemáticas alcanzan un AUC de 0.592, y la compuerta completa alcanza un AUC de 0.957 con atribución a nivel de condición. En experimentos de intervención basados en repetición, los filtros basados en residuos y la compuerta completa de admisibilidad física evitan entre el 87% y el 89% de las propuestas inválidas, manteniendo un progreso medio cercano a 0.998.
English
Predictive Physical AI systems output state rollouts, action chunks, and latent plans, yet a low root-mean-square error (RMSE) does not imply that a particular proposal is physically executable. We formulate physical admissibility as a prediction-control interface: before execution, a decoded proposal is treated as candidate dynamics and evaluated using kinematic, dynamic, and direct-to-composed horizon conditions. Passing is not a certificate of task success; rejection identifies violation of the specified physical envelope and gives a component-level reason. On Hugging Face LeRobot PushT, controlled falsification shows that one-step prediction-RMSE and standardized dynamics residuals reach area under the receiver operating characteristic curve (AUC) 0.982 and 0.972, kinematic-only conditions reach AUC 0.592, and the full gate reaches AUC 0.957 with condition-level attribution. In replay-based intervention experiments, residual-based filters and the full physical-admissibility gate prevent 87-$89% of invalid proposals while preserving mean progress near 0.998.