ChatPaper.aiChatPaper

Ark: Un marco de trabajo de código abierto basado en Python para el aprendizaje robótico

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
Autores: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

Resumen

La robótica ha logrado avances notables en hardware, desde los Desafíos Urbanos y de Robótica de DARPA hasta el primer torneo de kickboxing con robots humanoides, sin embargo, la autonomía comercial aún se queda atrás en comparación con los progresos en aprendizaje automático. Un cuello de botella importante es el software: las pilas de software robótico actuales requieren curvas de aprendizaje pronunciadas, experiencia en C/C++ de bajo nivel, herramientas fragmentadas e integración de hardware compleja, en marcado contraste con los ecosistemas centrados en Python y bien documentados que impulsaron la IA moderna. Presentamos ARK, un marco de robótica de código abierto y centrado en Python diseñado para cerrar esa brecha. ARK ofrece una interfaz de entorno al estilo Gym que permite a los usuarios recopilar datos, preprocesarlos y entrenar políticas utilizando algoritmos de aprendizaje por imitación de vanguardia (por ejemplo, ACT, Diffusion Policy), alternando sin problemas entre simulaciones de alta fidelidad y robots físicos. Una arquitectura cliente-servidor ligera proporciona comunicación en red mediante el modelo publicador-suscriptor, y los enlaces opcionales en C/C++ garantizan un rendimiento en tiempo real cuando es necesario. ARK incluye módulos reutilizables para control, SLAM, planificación de movimientos, identificación de sistemas y visualización, junto con interoperabilidad nativa con ROS. Documentación exhaustiva y estudios de caso, desde manipulación hasta navegación móvil, demuestran la creación rápida de prototipos, el intercambio sin esfuerzo de hardware y flujos de trabajo de extremo a extremo que rivalizan con la conveniencia de los flujos de trabajo principales de aprendizaje automático. Al unificar las prácticas de robótica e IA bajo un mismo paraguas de Python, ARK reduce las barreras de entrada y acelera la investigación y el despliegue comercial de robots autónomos.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF161June 30, 2025