ChatPaper.aiChatPaper

Ark : Un framework open-source basé sur Python pour l'apprentissage robotique

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
Auteurs: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

Résumé

La robotique a réalisé des avancées matérielles remarquables, des défis urbains et robotiques de la DARPA au premier tournoi de kickboxing entre robots humanoïdes. Pourtant, l'autonomie commerciale reste à la traîne par rapport aux progrès de l'apprentissage automatique. Un goulot d'étranglement majeur réside dans les logiciels : les piles logicielles actuelles pour robots exigent des courbes d'apprentissage abruptes, une expertise en C/C++ de bas niveau, des outils fragmentés et une intégration matérielle complexe, en contraste flagrant avec les écosystèmes centrés sur Python et bien documentés qui ont propulsé l'IA moderne. Nous présentons ARK, un framework robotique open-source axé sur Python, conçu pour combler cet écart. ARK propose une interface d'environnement de type Gym qui permet aux utilisateurs de collecter des données, de les prétraiter et d'entraîner des politiques à l'aide d'algorithmes d'apprentissage par imitation de pointe (par exemple, ACT, Diffusion Policy), tout en basculant de manière transparente entre une simulation haute fidélité et des robots physiques. Une architecture client-serveur légère assure une communication réseau de type éditeur-abonné, et des liaisons optionnelles en C/C++ garantissent des performances en temps réel lorsque nécessaire. ARK est livré avec des modules réutilisables pour le contrôle, la SLAM, la planification de mouvement, l'identification de systèmes et la visualisation, ainsi qu'une interopérabilité native avec ROS. Une documentation complète et des études de cas, allant de la manipulation à la navigation mobile, démontrent un prototypage rapide, un échange de matériel sans effort et des pipelines de bout en bout qui rivalisent avec la commodité des workflows d'apprentissage automatique grand public. En unifiant les pratiques de la robotique et de l'IA sous un même parapluie Python, ARK réduit les barrières à l'entrée et accélère la recherche et le déploiement commercial de robots autonomes.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF131June 30, 2025