ChatPaper.aiChatPaper

OpenHelix: Een Korte Verkenning, Empirische Analyse en Open-Source Dual-Systeem VLA-Model voor Robotmanipulatie

OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation

May 6, 2025
Auteurs: Can Cui, Pengxiang Ding, Wenxuan Song, Shuanghao Bai, Xinyang Tong, Zirui Ge, Runze Suo, Wanqi Zhou, Yang Liu, Bofang Jia, Han Zhao, Siteng Huang, Donglin Wang
cs.AI

Samenvatting

Dual-system VLA (Vision-Language-Actie) architecturen zijn een populair onderwerp geworden in onderzoek naar belichaamde intelligentie, maar er is een gebrek aan voldoende open-source werk voor verdere prestatieanalyse en optimalisatie. Om dit probleem aan te pakken, zal dit artikel de structurele ontwerpen van bestaande dual-system architecturen samenvatten en vergelijken, en systematische empirische evaluaties uitvoeren op de kernontwerpelementen van bestaande dual-system architecturen. Uiteindelijk zal het een kosteneffectief open-source model bieden voor verdere verkenning. Natuurlijk zal dit project blijven updaten met meer experimentele conclusies en open-source modellen met verbeterde prestaties waaruit iedereen kan kiezen. Projectpagina: https://openhelix-robot.github.io/.
English
Dual-system VLA (Vision-Language-Action) architectures have become a hot topic in embodied intelligence research, but there is a lack of sufficient open-source work for further performance analysis and optimization. To address this problem, this paper will summarize and compare the structural designs of existing dual-system architectures, and conduct systematic empirical evaluations on the core design elements of existing dual-system architectures. Ultimately, it will provide a low-cost open-source model for further exploration. Of course, this project will continue to update with more experimental conclusions and open-source models with improved performance for everyone to choose from. Project page: https://openhelix-robot.github.io/.
PDF81May 8, 2025