Ark : Un framework open-source basé sur Python pour l'apprentissage robotique
Ark: An Open-source Python-based Framework for Robot Learning
June 24, 2025
Auteurs: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI
Résumé
La robotique a réalisé des avancées matérielles remarquables, des défis urbains et robotiques de la DARPA au premier tournoi de kickboxing entre robots humanoïdes. Pourtant, l'autonomie commerciale reste à la traîne par rapport aux progrès de l'apprentissage automatique. Un goulot d'étranglement majeur réside dans les logiciels : les piles logicielles actuelles pour robots exigent des courbes d'apprentissage abruptes, une expertise en C/C++ de bas niveau, des outils fragmentés et une intégration matérielle complexe, en contraste flagrant avec les écosystèmes centrés sur Python et bien documentés qui ont propulsé l'IA moderne. Nous présentons ARK, un framework robotique open-source axé sur Python, conçu pour combler cet écart. ARK propose une interface d'environnement de type Gym qui permet aux utilisateurs de collecter des données, de les prétraiter et d'entraîner des politiques à l'aide d'algorithmes d'apprentissage par imitation de pointe (par exemple, ACT, Diffusion Policy), tout en basculant de manière transparente entre une simulation haute fidélité et des robots physiques. Une architecture client-serveur légère assure une communication réseau de type éditeur-abonné, et des liaisons optionnelles en C/C++ garantissent des performances en temps réel lorsque nécessaire. ARK est livré avec des modules réutilisables pour le contrôle, la SLAM, la planification de mouvement, l'identification de systèmes et la visualisation, ainsi qu'une interopérabilité native avec ROS. Une documentation complète et des études de cas, allant de la manipulation à la navigation mobile, démontrent un prototypage rapide, un échange de matériel sans effort et des pipelines de bout en bout qui rivalisent avec la commodité des workflows d'apprentissage automatique grand public. En unifiant les pratiques de la robotique et de l'IA sous un même parapluie Python, ARK réduit les barrières à l'entrée et accélère la recherche et le déploiement commercial de robots autonomes.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics
Challenges to the first humanoid-robot kickboxing tournament-yet commercial
autonomy still lags behind progress in machine learning. A major bottleneck is
software: current robot stacks demand steep learning curves, low-level C/C++
expertise, fragmented tooling, and intricate hardware integration, in stark
contrast to the Python-centric, well-documented ecosystems that propelled
modern AI. We introduce ARK, an open-source, Python-first robotics framework
designed to close that gap. ARK presents a Gym-style environment interface that
allows users to collect data, preprocess it, and train policies using
state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy)
while seamlessly toggling between high-fidelity simulation and physical robots.
A lightweight client-server architecture provides networked
publisher-subscriber communication, and optional C/C++ bindings ensure
real-time performance when needed. ARK ships with reusable modules for control,
SLAM, motion planning, system identification, and visualization, along with
native ROS interoperability. Comprehensive documentation and case studies-from
manipulation to mobile navigation-demonstrate rapid prototyping, effortless
hardware swapping, and end-to-end pipelines that rival the convenience of
mainstream machine-learning workflows. By unifying robotics and AI practices
under a common Python umbrella, ARK lowers entry barriers and accelerates
research and commercial deployment of autonomous robots.