ChatPaper.aiChatPaper

LEO-RobotAgent: Ein universeller Roboter-Agent für sprachgesteuerte verkörperte Operationen

LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator

December 11, 2025
papers.authors: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI

papers.abstract

Wir stellen LEO-RobotAgent vor, ein allgemeines sprachgestütztes intelligentes Agenten-Framework für Roboter. Innerhalb dieses Frameworks können LLMs verschiedene Robotertypen steuern, um unvorhersehbare komplexe Aufgaben in unterschiedlichsten Szenarien zu bewältigen. Dieses Framework zeichnet sich durch hohe Generalisierungsfähigkeit, Robustheit und Effizienz aus. Das darauf aufbauende Anwendungssystem kann das bidirektionale Verständnis zwischen Mensch und Roboter vollständig verbessern und die Schwelle für die Mensch-Roboter-Interaktion senken. In Bezug auf die Roboteraufgabenplanung konzentrieren sich die meisten bestehenden Studien auf den Einsatz großer Modelle in Einzelszenarien und für einzelne Robotertypen. Diese Algorithmen weisen oft komplexe Strukturen auf und mangelt es an Generalisierbarkeit. Daher ist das vorgeschlagene LEO-RobotAgent-Framework möglichst schlank strukturiert, um großen Modellen zu ermöglichen, innerhalb dieses klaren Frameworks eigenständig zu denken, zu planen und zu handeln. Wir stellen ein modular aufgebautes und einfach registrierbares Toolset bereit, das großen Modellen erlaubt, flexibel verschiedene Werkzeuge aufzurufen, um unterschiedliche Anforderungen zu erfüllen. Gleichzeitig integriert das Framework einen Mensch-Roboter-Interaktionsmechanismus, der es dem Algorithmus ermöglicht, wie ein Partner mit Menschen zusammenzuarbeiten. Experimente haben bestätigt, dass dieses Framework problemlos an主流 Roboterplattformen einschließlich unbemannter Luftfahrzeuge (UAVs), Roboterarme und fahrwerksbasierter Roboter adaptiert werden kann und dabei verschiedenste, sorgfältig entworfene Aufgaben unterschiedlicher Komplexitätsgrade effizient ausführt. Unser Code ist verfügbar unter https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.
PDF63December 17, 2025