ChatPaper.aiChatPaper

Ark: Un Framework Open-source Basato su Python per l'Apprendimento Robotico

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
Autori: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

Abstract

La robotica ha compiuto notevoli progressi hardware, dalle sfide urbane e robotiche di DARPA al primo torneo di kickboxing tra robot umanoidi, eppure l'autonomia commerciale rimane indietro rispetto ai progressi nel machine learning. Un collo di bottiglia significativo è il software: gli attuali stack robotici richiedono curve di apprendimento ripide, competenze di basso livello in C/C++, strumenti frammentati e un'integrazione hardware complessa, in netto contrasto con gli ecosistemi Python-centrici e ben documentati che hanno spinto l'IA moderna. Introduciamo ARK, un framework robotico open-source e Python-first progettato per colmare questo divario. ARK presenta un'interfaccia di ambiente in stile Gym che consente agli utenti di raccogliere dati, preprocessarli e addestrare politiche utilizzando algoritmi di apprendimento per imitazione all'avanguardia (ad esempio, ACT, Diffusion Policy), passando senza soluzione di continuità tra simulazione ad alta fedeltà e robot fisici. Un'architettura client-server leggera fornisce una comunicazione publisher-subscriber in rete, e i binding opzionali in C/C++ garantiscono prestazioni in tempo reale quando necessario. ARK include moduli riutilizzabili per il controllo, SLAM, pianificazione del movimento, identificazione del sistema e visualizzazione, insieme a un'interoperabilità nativa con ROS. Documentazione completa e casi di studio—dalla manipolazione alla navigazione mobile—dimostrano una prototipazione rapida, uno scambio hardware senza sforzo e pipeline end-to-end che rivaleggiano con la comodità dei flussi di lavoro mainstream del machine learning. Unificando le pratiche della robotica e dell'IA sotto un comune ombrello Python, ARK abbassa le barriere di ingresso e accelera la ricerca e il dispiegamento commerciale di robot autonomi.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF131June 30, 2025