ChatPaper.aiChatPaper

Podem as Dinâmicas Previstas Existir no Mundo Físico?

Can Predicted Dynamics Exist in the Physical World?

May 23, 2026
Autores: Barak Or
cs.AI

Resumo

Sistemas de IA Física Preditiva geram rollouts de estado, blocos de ação e planos latentes, porém um baixo erro quadrático médio (RMSE) não implica que uma proposta específica seja fisicamente executável. Formulamos a admissibilidade física como uma interface de previsão-controle: antes da execução, uma proposta decodificada é tratada como dinâmica candidata e avaliada utilizando condições cinemáticas, dinâmicas e de horizonte direto-para-composto. A aprovação não é um certificado de sucesso da tarefa; a rejeição identifica a violação do envelope físico especificado e fornece uma razão em nível de componente. No Hugging Face LeRobot PushT, a falsificação controlada mostra que o RMSE de previsão de um passo e os resíduos de dinâmica padronizados atingem área sob a curva característica de operação do receptor (AUC) 0,982 e 0,972, condições exclusivamente cinemáticas atingem AUC 0,592, e o portão completo atinge AUC 0,957 com atribuição em nível de condição. Em experimentos de intervenção baseados em replay, filtros baseados em resíduos e o portão completo de admissibilidade física previnem 87%-89% das propostas inválidas, preservando o progresso médio próximo a 0,998.
English
Predictive Physical AI systems output state rollouts, action chunks, and latent plans, yet a low root-mean-square error (RMSE) does not imply that a particular proposal is physically executable. We formulate physical admissibility as a prediction-control interface: before execution, a decoded proposal is treated as candidate dynamics and evaluated using kinematic, dynamic, and direct-to-composed horizon conditions. Passing is not a certificate of task success; rejection identifies violation of the specified physical envelope and gives a component-level reason. On Hugging Face LeRobot PushT, controlled falsification shows that one-step prediction-RMSE and standardized dynamics residuals reach area under the receiver operating characteristic curve (AUC) 0.982 and 0.972, kinematic-only conditions reach AUC 0.592, and the full gate reaches AUC 0.957 with condition-level attribution. In replay-based intervention experiments, residual-based filters and the full physical-admissibility gate prevent 87-$89% of invalid proposals while preserving mean progress near 0.998.