ChatPaper.aiChatPaper

MiMo-Embodied : Rapport technique sur le modèle de fondation X-Embodied

MiMo-Embodied: X-Embodied Foundation Model Technical Report

November 20, 2025
papers.authors: Xiaoshuai Hao, Lei Zhou, Zhijian Huang, Zhiwen Hou, Yingbo Tang, Lingfeng Zhang, Guang Li, Zheng Lu, Shuhuai Ren, Xianhui Meng, Yuchen Zhang, Jing Wu, Jinghui Lu, Chenxu Dang, Jiayi Guan, Jianhua Wu, Zhiyi Hou, Hanbing Li, Shumeng Xia, Mingliang Zhou, Yinan Zheng, Zihao Yue, Shuhao Gu, Hao Tian, Yuannan Shen, Jianwei Cui, Wen Zhang, Shaoqing Xu, Bing Wang, Haiyang Sun, Zeyu Zhu, Yuncheng Jiang, Zibin Guo, Chuhong Gong, Chaofan Zhang, Wenbo Ding, Kun Ma, Guang Chen, Rui Cai, Diyun Xiang, Heng Qu, Fuli Luo, Hangjun Ye, Long Chen
cs.AI

papers.abstract

Nous rendons public MiMo-Embodied, le premier modèle de fondation inter-embarqué à intégrer avec succès et à atteindre des performances de pointe à la fois dans la Conduite Autonome et l'IA Embarquée. MiMo-Embodied établit de nouveaux records sur 17 benchmarks d'IA embarquée dans les domaines de la Planification de Tâches, de la Prédiction d'Affordance et de la Compréhension Spatiale, tout en excellant également sur 12 benchmarks de conduite autonome couvrant la Perception de l'Environnement, la Prédiction d'État et la Planification de la Conduite. Sur l'ensemble de ces tâches, MiMo-Embodied surpasse significativement les lignes de base existantes, qu'elles soient open-source, fermées ou spécialisées. Nos résultats indiquent que grâce à un apprentissage multi-étapes, une construction de données soigneusement sélectionnées et un fine-tuning par CoT/RL, ces deux domaines présentent un fort transfert positif et se renforcent mutuellement. Nous fournissons une analyse détaillée de la conception de notre modèle et de nos méthodologies d'entraînement pour faciliter les recherches futures. Le code et les modèles sont disponibles à l'adresse https://github.com/XiaomiMiMo/MiMo-Embodied.
English
We open-source MiMo-Embodied, the first cross-embodied foundation model to successfully integrate and achieve state-of-the-art performance in both Autonomous Driving and Embodied AI. MiMo-Embodied sets new records across 17 embodied AI benchmarks in Task Planning, Affordance Prediction and Spatial Understanding, while also excelling in 12 autonomous driving benchmarks across Environmental Perception, Status Prediction, and Driving Planning. Across these tasks, MiMo-Embodied significantly outperforms existing open-source, closed-source, and specialized baselines. Our results indicate that through multi-stage learning, curated data construction, and CoT/RL fine-tuning, these two domains exhibit strong positive transfer and mutually reinforce one another. We provide a detailed analysis of our model design and training methodologies to facilitate further research. Code and models are available at https://github.com/XiaomiMiMo/MiMo-Embodied.
PDF232December 1, 2025