MiMo-Embodied: Relatório Técnico do Modelo de Fundação X-Embodied

Resumo

Lançamos em código aberto o MiMo-Embodied, o primeiro modelo de base cross-embodied a integrar com sucesso e alcançar desempenho de ponta tanto em Condução Autónoma como em IA Embutida. O MiMo-Embodied estabelece novos recordes em 17 benchmarks de IA embutida nas áreas de Planeamento de Tarefas, Previsão de *Affordance* e Compreensão Espacial, ao mesmo tempo que se destaca em 12 benchmarks de condução autónoma nas áreas de Perceção Ambiental, Previsão de Estado e Planeamento de Condução. Nestas tarefas, o MiMo-Embodied supera significativamente as linhas de base existentes, sejam de código aberto, fechado ou especializadas. Os nossos resultados indicam que, através de aprendizagem multiestágio, construção curada de dados e afinação por CoT/RL, estes dois domínios exibem uma forte transferência positiva e reforçam-se mutuamente. Fornecemos uma análise detalhada do nosso modelo de conceção e metodologias de treino para facilitar investigações futuras. O código e os modelos estão disponíveis em https://github.com/XiaomiMiMo/MiMo-Embodied.

English

We open-source MiMo-Embodied, the first cross-embodied foundation model to successfully integrate and achieve state-of-the-art performance in both Autonomous Driving and Embodied AI. MiMo-Embodied sets new records across 17 embodied AI benchmarks in Task Planning, Affordance Prediction and Spatial Understanding, while also excelling in 12 autonomous driving benchmarks across Environmental Perception, Status Prediction, and Driving Planning. Across these tasks, MiMo-Embodied significantly outperforms existing open-source, closed-source, and specialized baselines. Our results indicate that through multi-stage learning, curated data construction, and CoT/RL fine-tuning, these two domains exhibit strong positive transfer and mutually reinforce one another. We provide a detailed analysis of our model design and training methodologies to facilitate further research. Code and models are available at https://github.com/XiaomiMiMo/MiMo-Embodied.

MiMo-Embodied: Relatório Técnico do Modelo de Fundação X-Embodied

MiMo-Embodied: X-Embodied Foundation Model Technical Report

Resumo

Support