ChatPaper.aiChatPaper

Ark: Ein Open-Source-Python-Framework für Robotik-Lernen

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
papers.authors: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

papers.abstract

Die Robotik hat bemerkenswerte Fortschritte in der Hardware erzielt – von den Urban und Robotics Challenges der DARPA bis hin zum ersten humanoiden Kickbox-Turnier für Roboter – doch die kommerzielle Autonomie hinkt den Fortschritten im maschinellen Lernen noch hinterher. Ein wesentlicher Engpass ist die Software: Aktuelle Robotik-Stacks erfordern steile Lernkurven, Expertise in Low-Level-C/C++, fragmentierte Werkzeuge und komplexe Hardware-Integration, im starken Kontrast zu den Python-zentrierten, gut dokumentierten Ökosystemen, die die moderne KI vorangetrieben haben. Wir stellen ARK vor, ein Open-Source, Python-first Robotik-Framework, das diese Lücke schließen soll. ARK bietet eine Gym-ähnliche Umgebungsschnittstelle, die es Nutzern ermöglicht, Daten zu sammeln, diese vorzuverarbeiten und Richtlinien mit modernsten Imitationslernalgorithmen (z. B. ACT, Diffusion Policy) zu trainieren, während nahtlos zwischen hochgenauer Simulation und physischen Robotern gewechselt werden kann. Eine leichtgewichtige Client-Server-Architektur ermöglicht eine vernetzte Publisher-Subscriber-Kommunikation, und optionale C/C++-Bindings gewährleisten bei Bedarf Echtzeit-Leistung. ARK wird mit wiederverwendbaren Modulen für Steuerung, SLAM, Bewegungsplanung, Systemidentifikation und Visualisierung sowie nativer ROS-Interoperabilität ausgeliefert. Umfassende Dokumentation und Fallstudien – von der Manipulation bis zur mobilen Navigation – demonstrieren schnelles Prototyping, mühelosen Hardware-Austausch und End-to-End-Pipelines, die die Bequemlichkeit gängiger maschineller Lern-Workflows erreichen. Indem ARK Robotik- und KI-Praktiken unter einem gemeinsamen Python-Dach vereint, senkt es die Einstiegshürden und beschleunigt die Forschung und kommerzielle Bereitstellung autonomer Roboter.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF161June 30, 2025