Может ли предсказанная динамика существовать в физическом мире?
Can Predicted Dynamics Exist in the Physical World?
May 23, 2026
Авторы: Barak Or
cs.AI
Аннотация
Системы прогностического физического ИИ генерируют развертки состояний, фрагменты действий и скрытые планы, однако низкая среднеквадратическая ошибка (RMSE) не гарантирует физическую выполнимость конкретного предложения. Мы формулируем физическую допустимость как интерфейс прогнозирования и управления: перед выполнением декодированное предложение рассматривается как кандидатная динамика и оценивается с помощью кинематических, динамических и непосредственно-составных горизонтных условий. Прохождение проверки не является сертификатом успешности задачи; отклонение выявляет нарушение заданной физической оболочки и дает причину на уровне компонентов. На платформе Hugging Face LeRobot PushT контролируемое опровержение показывает, что одномоментная прогностическая RMSE и стандартизированные динамические невязки достигают площади под кривой ошибок (AUC) 0.982 и 0.972, кинематические условия — AUC 0.592, а полный фильтр — AUC 0.957 с атрибуцией на уровне условий. В экспериментах с вмешательством на основе воспроизведения фильтры, основанные на невязках, и полный фильтр физической допустимости предотвращают 87–89% недопустимых предложений, сохраняя средний прогресс на уровне приблизительно 0.998.
English
Predictive Physical AI systems output state rollouts, action chunks, and latent plans, yet a low root-mean-square error (RMSE) does not imply that a particular proposal is physically executable. We formulate physical admissibility as a prediction-control interface: before execution, a decoded proposal is treated as candidate dynamics and evaluated using kinematic, dynamic, and direct-to-composed horizon conditions. Passing is not a certificate of task success; rejection identifies violation of the specified physical envelope and gives a component-level reason. On Hugging Face LeRobot PushT, controlled falsification shows that one-step prediction-RMSE and standardized dynamics residuals reach area under the receiver operating characteristic curve (AUC) 0.982 and 0.972, kinematic-only conditions reach AUC 0.592, and the full gate reaches AUC 0.957 with condition-level attribution. In replay-based intervention experiments, residual-based filters and the full physical-admissibility gate prevent 87-$89% of invalid proposals while preserving mean progress near 0.998.