ChatPaper.aiChatPaper

Kan voorspelde dynamica bestaan in de fysische wereld?

Can Predicted Dynamics Exist in the Physical World?

May 23, 2026
Auteurs: Barak Or
cs.AI

Samenvatting

Voorspellende fysieke AI-systemen leveren toestandsuitrollen, actiebrokken en latente plannen, maar een lage root-mean-square-fout (RMSE) impliceert niet dat een bepaald voorstel fysiek uitvoerbaar is. We formuleren fysieke toelaatbaarheid als een voorspelling-regelinterface: vóór uitvoering wordt een gedecodeerd voorstel behandeld als kandidaatdynamica en geëvalueerd met behulp van kinematische, dynamische en direct-naar-samengestelde horizonvoorwaarden. Het doorstaan is geen certificaat van taaksucces; verwerping identificeert schending van de gespecificeerde fysieke omhullende en geeft een reden op componentniveau. Op Hugging Face LeRobot PushT toont gecontroleerde falsificatie aan dat eenstapsvoorspelling-RMSE en gestandaardiseerde dynamicaresiduen een oppervlakte onder de receiver operating characteristic-curve (AUC) bereiken van respectievelijk 0,982 en 0,972, alleen kinematische voorwaarden een AUC van 0,592, en de volledige poort een AUC van 0,957 met attributie op conditieniveau. In replay-gebaseerde interventie-experimenten voorkomen residugebaseerde filters en de volledige fysieke-toelaatbaarheidspoort 87–89% van de ongeldige voorstellen, met behoud van een gemiddelde voortgang nabij 0,998.
English
Predictive Physical AI systems output state rollouts, action chunks, and latent plans, yet a low root-mean-square error (RMSE) does not imply that a particular proposal is physically executable. We formulate physical admissibility as a prediction-control interface: before execution, a decoded proposal is treated as candidate dynamics and evaluated using kinematic, dynamic, and direct-to-composed horizon conditions. Passing is not a certificate of task success; rejection identifies violation of the specified physical envelope and gives a component-level reason. On Hugging Face LeRobot PushT, controlled falsification shows that one-step prediction-RMSE and standardized dynamics residuals reach area under the receiver operating characteristic curve (AUC) 0.982 and 0.972, kinematic-only conditions reach AUC 0.592, and the full gate reaches AUC 0.957 with condition-level attribution. In replay-based intervention experiments, residual-based filters and the full physical-admissibility gate prevent 87-$89% of invalid proposals while preserving mean progress near 0.998.