ChatPaper.aiChatPaper

LEO-RobotAgent: Un Agente Robotico Versatile per Operatori Incorporati Guidati dal Linguaggio

LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator

December 11, 2025
Autori: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI

Abstract

Proponiamo LEO-RobotAgent, un framework di agenti intelligenti general-purpose guidati dal linguaggio per robot. Questo framework consente ai Large Language Model (LLM) di operare diversi tipi di robot per completare compiti complessi e imprevedibili in vari scenari. Il framework si caratterizza per una forte generalizzazione, robustezza ed efficienza. Il sistema a livello applicativo costruito attorno ad esso può potenziare completamente la comprensione bidirezionale delle intenzioni uomo-robot e abbassare la soglia per l'interazione uomo-robot. Per quanto riguarda la pianificazione dei compiti robotici, la stragrande maggioranza degli studi esistenti si concentra sull'applicazione di grandi modelli in scenari a compito singolo e per singoli tipi di robot. Questi algoritmi hanno spesso strutture complesse e mancano di generalizzabilità. Pertanto, il framework LEO-RobotAgent proposto è progettato con una struttura il più snella possibile, permettendo ai grandi modelli di pensare, pianificare e agire in modo indipendente all'interno di questa struttura chiara. Forniamo un set di strumenti modulare e di facile registrazione, che consente ai grandi modelli di richiamare flessibilmente vari strumenti per soddisfare diverse esigenze. Nel contempo, il framework incorpora un meccanismo di interazione uomo-robot, permettendo all'algoritmo di collaborare con gli esseri umani come un partner. Gli esperimenti hanno verificato che questo framework può essere facilmente adattato alle principali piattaforme robotiche, inclusi droni (UAV), bracci robotici e robot su ruote, ed eseguire efficientemente una varietà di compiti accuratamente progettati con diversi livelli di complessità. Il nostro codice è disponibile all'indirizzo https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.
PDF63December 17, 2025