Ark: ロボット学習のためのオープンソースPythonフレームワーク
Ark: An Open-source Python-based Framework for Robot Learning
June 24, 2025
著者: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI
要旨
ロボティクスは、DARPAのUrban ChallengeやRobotics Challengeから初のヒューマノイドロボットキックボクシングトーナメントに至るまで、ハードウェアにおいて目覚ましい進歩を遂げてきた。しかし、商業的な自律性は機械学習の進歩に比べて依然として遅れを取っている。その主なボトルネックはソフトウェアにある。現在のロボットスタックは、急勾配の学習曲線、低レベルのC/C++専門知識、断片化されたツール、そして複雑なハードウェア統合を要求しており、現代のAIを推進したPython中心の、よくドキュメント化されたエコシステムとは対照的である。我々は、そのギャップを埋めるために設計されたオープンソースのPythonファーストロボティクスフレームワーク、ARKを紹介する。ARKは、ユーザーがデータを収集し、前処理を行い、最先端の模倣学習アルゴリズム(例:ACT、Diffusion Policy)を使用してポリシーをトレーニングできるGymスタイルの環境インターフェースを提供し、高精度シミュレーションと物理ロボットの間をシームレスに切り替えることができる。軽量なクライアント-サーバーアーキテクチャは、ネットワーク化されたパブリッシャー-サブスクライバー通信を提供し、必要に応じてオプションのC/C++バインディングがリアルタイム性能を保証する。ARKは、制御、SLAM、モーションプランニング、システム同定、可視化のための再利用可能なモジュールを提供し、ネイティブのROS相互運用性を備えている。包括的なドキュメントとケーススタディ(操作からモバイルナビゲーションまで)は、迅速なプロトタイピング、容易なハードウェア交換、そして主流の機械学習ワークフローに匹敵するエンドツーエンドのパイプラインを実証している。ARKは、ロボティクスとAIの実践を共通のPythonの傘の下に統合することで、参入障壁を下げ、自律ロボットの研究と商業展開を加速する。
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics
Challenges to the first humanoid-robot kickboxing tournament-yet commercial
autonomy still lags behind progress in machine learning. A major bottleneck is
software: current robot stacks demand steep learning curves, low-level C/C++
expertise, fragmented tooling, and intricate hardware integration, in stark
contrast to the Python-centric, well-documented ecosystems that propelled
modern AI. We introduce ARK, an open-source, Python-first robotics framework
designed to close that gap. ARK presents a Gym-style environment interface that
allows users to collect data, preprocess it, and train policies using
state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy)
while seamlessly toggling between high-fidelity simulation and physical robots.
A lightweight client-server architecture provides networked
publisher-subscriber communication, and optional C/C++ bindings ensure
real-time performance when needed. ARK ships with reusable modules for control,
SLAM, motion planning, system identification, and visualization, along with
native ROS interoperability. Comprehensive documentation and case studies-from
manipulation to mobile navigation-demonstrate rapid prototyping, effortless
hardware swapping, and end-to-end pipelines that rival the convenience of
mainstream machine-learning workflows. By unifying robotics and AI practices
under a common Python umbrella, ARK lowers entry barriers and accelerates
research and commercial deployment of autonomous robots.