Ark: Um Framework Python de Código Aberto para Aprendizado de Robótica
Ark: An Open-source Python-based Framework for Robot Learning
June 24, 2025
Autores: Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
cs.AI
Resumo
A robótica fez avanços notáveis em hardware - desde os Desafios Urbanos e de Robótica da DARPA até o primeiro torneio de kickboxing com robôs humanoides - mas a autonomia comercial ainda está atrás do progresso em aprendizado de máquina. Um grande gargalo é o software: as pilhas de software atuais para robôs exigem curvas de aprendizado íngremes, expertise em C/C++ de baixo nível, ferramentas fragmentadas e integração complexa de hardware, em contraste marcante com os ecossistemas centrados em Python e bem documentados que impulsionaram a IA moderna. Apresentamos o ARK, um framework de robótica de código aberto e focado em Python, projetado para fechar essa lacuna. O ARK oferece uma interface de ambiente no estilo Gym que permite aos usuários coletar dados, pré-processá-los e treinar políticas usando algoritmos de aprendizado por imitação de ponta (por exemplo, ACT, Diffusion Policy), alternando de forma contínua entre simulação de alta fidelidade e robôs físicos. Uma arquitetura cliente-servidor leve fornece comunicação em rede no modelo publisher-subscriber, e bindings opcionais em C/C++ garantem desempenho em tempo real quando necessário. O ARK vem com módulos reutilizáveis para controle, SLAM, planejamento de movimento, identificação de sistemas e visualização, além de interoperabilidade nativa com ROS. Documentação abrangente e estudos de caso - desde manipulação até navegação móvel - demonstram prototipagem rápida, troca de hardware sem esforço e pipelines de ponta a ponta que rivalizam com a conveniência dos fluxos de trabalho de aprendizado de máquina mais comuns. Ao unificar práticas de robótica e IA sob um guarda-chuva comum em Python, o ARK reduz barreiras de entrada e acelera a pesquisa e a implantação comercial de robôs autônomos.
English
Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics
Challenges to the first humanoid-robot kickboxing tournament-yet commercial
autonomy still lags behind progress in machine learning. A major bottleneck is
software: current robot stacks demand steep learning curves, low-level C/C++
expertise, fragmented tooling, and intricate hardware integration, in stark
contrast to the Python-centric, well-documented ecosystems that propelled
modern AI. We introduce ARK, an open-source, Python-first robotics framework
designed to close that gap. ARK presents a Gym-style environment interface that
allows users to collect data, preprocess it, and train policies using
state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy)
while seamlessly toggling between high-fidelity simulation and physical robots.
A lightweight client-server architecture provides networked
publisher-subscriber communication, and optional C/C++ bindings ensure
real-time performance when needed. ARK ships with reusable modules for control,
SLAM, motion planning, system identification, and visualization, along with
native ROS interoperability. Comprehensive documentation and case studies-from
manipulation to mobile navigation-demonstrate rapid prototyping, effortless
hardware swapping, and end-to-end pipelines that rival the convenience of
mainstream machine-learning workflows. By unifying robotics and AI practices
under a common Python umbrella, ARK lowers entry barriers and accelerates
research and commercial deployment of autonomous robots.