ChatPaper.aiChatPaper

OpenHelix: ロボットマニピュレーションのための短いサーベイ、実証分析、およびオープンソースのデュアルシステムVLAモデル

OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation

May 6, 2025
著者: Can Cui, Pengxiang Ding, Wenxuan Song, Shuanghao Bai, Xinyang Tong, Zirui Ge, Runze Suo, Wanqi Zhou, Yang Liu, Bofang Jia, Han Zhao, Siteng Huang, Donglin Wang
cs.AI

要旨

デュアルシステムVLA(Vision-Language-Action)アーキテクチャは、エンボディードインテリジェンス研究におけるホットトピックとなっていますが、さらなる性能分析と最適化のための十分なオープンソース作業が不足しています。この問題に対処するため、本論文では既存のデュアルシステムアーキテクチャの構造設計をまとめ、比較し、既存のデュアルシステムアーキテクチャのコア設計要素について体系的な実証評価を行います。最終的には、さらなる探求のための低コストのオープンソースモデルを提供します。もちろん、このプロジェクトは、より多くの実験的結論と性能が向上したオープンソースモデルを継続的に更新し、誰もが選択できるようにします。プロジェクトページ: https://openhelix-robot.github.io/。
English
Dual-system VLA (Vision-Language-Action) architectures have become a hot topic in embodied intelligence research, but there is a lack of sufficient open-source work for further performance analysis and optimization. To address this problem, this paper will summarize and compare the structural designs of existing dual-system architectures, and conduct systematic empirical evaluations on the core design elements of existing dual-system architectures. Ultimately, it will provide a low-cost open-source model for further exploration. Of course, this project will continue to update with more experimental conclusions and open-source models with improved performance for everyone to choose from. Project page: https://openhelix-robot.github.io/.

Summary

AI-Generated Summary

PDF71May 8, 2025