ChatPaper.aiChatPaper

Ark: ロボット学習のためのオープンソースPythonフレームワーク

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
著者: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

要旨

ロボティクスは、DARPAのUrban ChallengeやRobotics Challengeから初のヒューマノイドロボットキックボクシングトーナメントに至るまで、ハードウェアにおいて目覚ましい進歩を遂げてきた。しかし、商業的な自律性は機械学習の進歩に比べて依然として遅れを取っている。その主なボトルネックはソフトウェアにある。現在のロボットスタックは、急勾配の学習曲線、低レベルのC/C++専門知識、断片化されたツール、そして複雑なハードウェア統合を要求しており、現代のAIを推進したPython中心の、よくドキュメント化されたエコシステムとは対照的である。我々は、そのギャップを埋めるために設計されたオープンソースのPythonファーストロボティクスフレームワーク、ARKを紹介する。ARKは、ユーザーがデータを収集し、前処理を行い、最先端の模倣学習アルゴリズム(例:ACT、Diffusion Policy)を使用してポリシーをトレーニングできるGymスタイルの環境インターフェースを提供し、高精度シミュレーションと物理ロボットの間をシームレスに切り替えることができる。軽量なクライアント-サーバーアーキテクチャは、ネットワーク化されたパブリッシャー-サブスクライバー通信を提供し、必要に応じてオプションのC/C++バインディングがリアルタイム性能を保証する。ARKは、制御、SLAM、モーションプランニング、システム同定、可視化のための再利用可能なモジュールを提供し、ネイティブのROS相互運用性を備えている。包括的なドキュメントとケーススタディ(操作からモバイルナビゲーションまで)は、迅速なプロトタイピング、容易なハードウェア交換、そして主流の機械学習ワークフローに匹敵するエンドツーエンドのパイプラインを実証している。ARKは、ロボティクスとAIの実践を共通のPythonの傘の下に統合することで、参入障壁を下げ、自律ロボットの研究と商業展開を加速する。
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF131June 30, 2025