Können vorhergesagte Dynamiken in der physikalischen Welt existieren?
Can Predicted Dynamics Exist in the Physical World?
May 23, 2026
Autoren: Barak Or
cs.AI
Zusammenfassung
Prädiktive Physical-AI-Systeme geben Zustands-Rollouts, Aktions-Chunks und latente Pläne aus, jedoch impliziert ein niedriger quadratischer Mittelfehler (RMSE) nicht, dass ein bestimmter Vorschlag physikalisch ausführbar ist. Wir formulieren physikalische Zulässigkeit als eine Vorhersage-Steuerungsschnittstelle: Vor der Ausführung wird ein dekodierter Vorschlag als Kandidatendynamik behandelt und mittels kinematischer, dynamischer sowie direkt-zu-zusammengesetzter Horizontbedingungen evaluiert. Das Bestehen ist kein Garant für Aufgabenerfolg; eine Zurückweisung identifiziert eine Verletzung des spezifizierten physikalischen Rahmens und liefert eine komponentenbezogene Begründung. Auf Hugging Face LeRobot PushT zeigt kontrollierte Falsifikation, dass der ein-Schritt-Vorhersage-RMSE und standardisierte Dynamikresiduen eine Fläche unter der Receiver-Operating-Characteristic-Kurve (AUC) von 0,982 bzw. 0,972 erreichen, rein kinematische Bedingungen eine AUC von 0,592, und das vollständige Gatter eine AUC von 0,957 mit bedingungsbezogener Zuordnung. In wiederholungsbasierten Interventionsversuchen verhindern residuenbasierte Filter und das vollständige physikalische Zulässigkeitsgatter 87–89 % der ungültigen Vorschläge, während der mittlere Fortschritt nahe 0,998 erhalten bleibt.
English
Predictive Physical AI systems output state rollouts, action chunks, and latent plans, yet a low root-mean-square error (RMSE) does not imply that a particular proposal is physically executable. We formulate physical admissibility as a prediction-control interface: before execution, a decoded proposal is treated as candidate dynamics and evaluated using kinematic, dynamic, and direct-to-composed horizon conditions. Passing is not a certificate of task success; rejection identifies violation of the specified physical envelope and gives a component-level reason. On Hugging Face LeRobot PushT, controlled falsification shows that one-step prediction-RMSE and standardized dynamics residuals reach area under the receiver operating characteristic curve (AUC) 0.982 and 0.972, kinematic-only conditions reach AUC 0.592, and the full gate reaches AUC 0.957 with condition-level attribution. In replay-based intervention experiments, residual-based filters and the full physical-admissibility gate prevent 87-$89% of invalid proposals while preserving mean progress near 0.998.