ChatPaper.aiChatPaper

OpenHelix: 로봇 매니퓰레이션을 위한 간단한 조사, 실증 분석 및 오픈소스 듀얼 시스템 VLA 모델

OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation

May 6, 2025
저자: Can Cui, Pengxiang Ding, Wenxuan Song, Shuanghao Bai, Xinyang Tong, Zirui Ge, Runze Suo, Wanqi Zhou, Yang Liu, Bofang Jia, Han Zhao, Siteng Huang, Donglin Wang
cs.AI

초록

이중 시스템 VLA(Vision-Language-Action) 아키텍처는 구체화된 지능 연구 분야에서 핫 토픽으로 떠올랐지만, 성능 분석과 최적화를 위한 충분한 오픈소스 작업이 부족한 실정이다. 이 문제를 해결하기 위해, 본 논문은 기존 이중 시스템 아키텍처의 구조적 설계를 요약하고 비교하며, 핵심 설계 요소에 대한 체계적인 실증 평가를 수행할 것이다. 궁극적으로, 추가 탐구를 위한 저비용 오픈소스 모델을 제공할 예정이다. 물론, 이 프로젝트는 더 많은 실험 결과와 개선된 성능의 오픈소스 모델을 지속적으로 업데이트하여 모두가 선택할 수 있도록 할 것이다. 프로젝트 페이지: https://openhelix-robot.github.io/.
English
Dual-system VLA (Vision-Language-Action) architectures have become a hot topic in embodied intelligence research, but there is a lack of sufficient open-source work for further performance analysis and optimization. To address this problem, this paper will summarize and compare the structural designs of existing dual-system architectures, and conduct systematic empirical evaluations on the core design elements of existing dual-system architectures. Ultimately, it will provide a low-cost open-source model for further exploration. Of course, this project will continue to update with more experimental conclusions and open-source models with improved performance for everyone to choose from. Project page: https://openhelix-robot.github.io/.

Summary

AI-Generated Summary

PDF71May 8, 2025