LEO-RobotAgent: Un Agente Robótico de Propósito General para Operadores Corporizados Guiados por Lenguaje
LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator
December 11, 2025
Autores: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI
Resumen
Proponemos LEO-RobotAgent, un marco de agente inteligente general impulsado por lenguaje para robots. Bajo este marco, los Modelos de Lenguaje Grandes (LLMs) pueden operar diferentes tipos de robots para completar tareas complejas e impredecibles en diversos escenarios. Este marco se caracteriza por una fuerte generalización, robustez y eficiencia. El sistema a nivel de aplicación construido en torno a él puede potenciar completamente la comprensión bidireccional de la intención humano-robot y reducir el umbral para la interacción humano-robot. En lo que respecta a la planificación de tareas robóticas, la gran mayoría de los estudios existentes se centran en la aplicación de modelos grandes en escenarios de tarea única y para tipos de robot individuales. Estos algoritmos suelen tener estructuras complejas y carecen de generalización. Por lo tanto, el marco LEO-RobotAgent propuesto está diseñado con una estructura simplificada en la medida de lo posible, permitiendo que los modelos grandes piensen, planifiquen y actúen de forma independiente dentro de este marco claro. Proporcionamos un conjunto de herramientas modular y de fácil registro, que permite a los modelos grandes invocar de manera flexible diversas herramientas para satisfacer diferentes requisitos. Simultáneamente, el marco incorpora un mecanismo de interacción humano-robot, permitiendo que el algoritmo colabore con los humanos como un compañero. Los experimentos han verificado que este marco puede adaptarse fácilmente a plataformas robóticas principales, incluyendo vehículos aéreos no tripulados (UAVs), brazos robóticos y robots con ruedas, y ejecutar de manera eficiente una variedad de tareas cuidadosamente diseñadas con diferentes niveles de complejidad. Nuestro código está disponible en https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.