ChatPaper.aiChatPaper

Ark: Um Framework Python de Código Aberto para Aprendizado de Robótica

Ark: An Open-source Python-based Framework for Robot Learning

June 24, 2025
Autores: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI

Resumo

A robótica fez avanços notáveis em hardware - desde os Desafios Urbanos e de Robótica da DARPA até o primeiro torneio de kickboxing com robôs humanoides - mas a autonomia comercial ainda está atrás do progresso em aprendizado de máquina. Um grande gargalo é o software: as pilhas de software atuais para robôs exigem curvas de aprendizado íngremes, expertise em C/C++ de baixo nível, ferramentas fragmentadas e integração complexa de hardware, em contraste marcante com os ecossistemas centrados em Python e bem documentados que impulsionaram a IA moderna. Apresentamos o ARK, um framework de robótica de código aberto e focado em Python, projetado para fechar essa lacuna. O ARK oferece uma interface de ambiente no estilo Gym que permite aos usuários coletar dados, pré-processá-los e treinar políticas usando algoritmos de aprendizado por imitação de ponta (por exemplo, ACT, Diffusion Policy), alternando de forma contínua entre simulação de alta fidelidade e robôs físicos. Uma arquitetura cliente-servidor leve fornece comunicação em rede no modelo publisher-subscriber, e bindings opcionais em C/C++ garantem desempenho em tempo real quando necessário. O ARK vem com módulos reutilizáveis para controle, SLAM, planejamento de movimento, identificação de sistemas e visualização, além de interoperabilidade nativa com ROS. Documentação abrangente e estudos de caso - desde manipulação até navegação móvel - demonstram prototipagem rápida, troca de hardware sem esforço e pipelines de ponta a ponta que rivalizam com a conveniência dos fluxos de trabalho de aprendizado de máquina mais comuns. Ao unificar práticas de robótica e IA sob um guarda-chuva comum em Python, o ARK reduz barreiras de entrada e acelera a pesquisa e a implantação comercial de robôs autônomos.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
PDF141June 30, 2025