OpenHelix : Une brève étude, analyse empirique et modèle VLA à double système open-source pour la manipulation robotique
OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation
May 6, 2025
Auteurs: Can Cui, Pengxiang Ding, Wenxuan Song, Shuanghao Bai, Xinyang Tong, Zirui Ge, Runze Suo, Wanqi Zhou, Yang Liu, Bofang Jia, Han Zhao, Siteng Huang, Donglin Wang
cs.AI
Résumé
Les architectures VLA (Vision-Langage-Action) à double système sont devenues un sujet brûlant dans la recherche sur l'intelligence incarnée, mais il manque suffisamment de travaux open source pour une analyse et une optimisation approfondies des performances. Pour résoudre ce problème, cet article résumera et comparera les conceptions structurelles des architectures à double système existantes, et mènera des évaluations empiriques systématiques sur les éléments de conception clés de ces architectures. En fin de compte, il fournira un modèle open source à faible coût pour une exploration ultérieure. Bien sûr, ce projet continuera à s'enrichir avec davantage de conclusions expérimentales et de modèles open source aux performances améliorées, disponibles pour tous. Page du projet : https://openhelix-robot.github.io/.
English
Dual-system VLA (Vision-Language-Action) architectures have become a hot
topic in embodied intelligence research, but there is a lack of sufficient
open-source work for further performance analysis and optimization. To address
this problem, this paper will summarize and compare the structural designs of
existing dual-system architectures, and conduct systematic empirical
evaluations on the core design elements of existing dual-system architectures.
Ultimately, it will provide a low-cost open-source model for further
exploration. Of course, this project will continue to update with more
experimental conclusions and open-source models with improved performance for
everyone to choose from. Project page: https://openhelix-robot.github.io/.Summary
AI-Generated Summary