ChatPaper.aiChatPaper

LEO-RobotAgent: Een Algemeen Toepasbare Robotagent voor Taalgedreven Lichamelijke Bediening

LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator

December 11, 2025
Auteurs: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI

Samenvatting

Wij presenteren LEO-RobotAgent, een algemeen taalgestuurd raamwerk voor intelligente robotagenten. Binnen dit raamwerk kunnen grote taalmodellen (LLM's) verschillende soorten robots aansturen om onvoorspelbare complexe taken in uiteenlopende scenario's uit te voeren. Dit raamwerk kenmerkt zich door sterke generalisatie, robuustheid en efficiëntie. Het hieromheen gebouwde toepassingssysteem kan het bidirectionele begrip van mens-robotintenties volledig verbeteren en de drempel voor mens-robotinteractie verlagen. Wat betreft robottaakplanning richten de meeste bestaande onderzoeken zich op de toepassing van grote modellen in scenario's met enkelvoudige taken en voor enkelvoudige robottypes. Deze algoritmen hebben vaak complexe structuren en missen generaliseerbaarheid. Daarom is het voorgestelde LEO-RobotAgent-raamwerk zo veel mogelijk met een gestroomlijnde structuur ontworpen, waardoor grote modellen zelfstandig kunnen denken, plannen en handelen binnen dit duidelijke kader. Wij bieden een modulaire en eenvoudig registreerbare toolset, waardoor grote modellen flexibel diverse tools kunnen aanroepen om aan verschillende eisen te voldoen. Tegelijkertijd integreert het raamwerk een mens-robotinteractiemechanisme, waardoor het algoritme kan samenwerken met mensen als een partner. Experimenten hebben bevestigd dat dit raamwerk eenvoudig kan worden aangepast aan mainstream robotplatforms, waaronder onbemande luchtvaartuigen (UAV's), robotarmen en wielrobots, en efficiënt diverse zorgvuldig ontworpen taken met verschillende complexiteitsniveaus kan uitvoeren. Onze code is beschikbaar op https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.
PDF63December 17, 2025