ChatPaper.aiChatPaper

LEO-RobotAgent : Un agent robotique polyvalent pour opérateur incarné piloté par le langage

LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator

December 11, 2025
papers.authors: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI

papers.abstract

Nous proposons LEO-RobotAgent, un cadre d'agent intelligent polyvalent piloté par le langage pour les robots. Dans ce cadre, les grands modèles de langage (LLM) peuvent opérer différents types de robots pour accomplir des tâches complexes imprévisibles dans divers scénarios. Ce cadre se caractérise par une forte généralisation, une robustesse et une efficacité. Le système applicatif construit autour peut améliorer pleinement la compréhension bidirectionnelle des intentions humain-robot et abaisser le seuil d'interaction humain-robot. Concernant la planification des tâches robotiques, la grande majorité des études existantes se concentrent sur l'application des grands modèles dans des scénarios à tâche unique et pour des types de robots uniques. Ces algorithmes ont souvent des structures complexes et manquent de généralisabilité. Ainsi, le cadre LEO-RobotAgent proposé est conçu avec une structure rationalisée autant que possible, permettant aux grands modèles de penser, planifier et agir de manière indépendante dans ce cadre clair. Nous fournissons une boîte à outils modulaire et facilement enregistrable, permettant aux grands modèles d'appeler flexibly divers outils pour répondre à différentes exigences. Parallèlement, le cadre intègre un mécanisme d'interaction humain-robot, permettant à l'algorithme de collaborer avec les humains comme un partenaire. Les expériences ont vérifié que ce cadre peut être facilement adapté aux plates-formes robotiques grand public, y compris les véhicules aériens sans pilote (UAV), les bras robotiques et les robots à roues, et exécuter efficacement une variété de tâches soigneusement conçues avec différents niveaux de complexité. Notre code est disponible à l'adresse https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.
PDF63December 17, 2025