ChatPaper.aiChatPaper

LEO-RobotAgent: Универсальный роботизированный агент для управления с помощью языка в физическом мире

LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator

December 11, 2025
Авторы: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI

Аннотация

Мы представляем LEO-RobotAgent — универсальную框架 интеллектуального агента для роботов, управляемого естественным языком. В рамках данной системы крупные языковые модели (LLM) способны управлять различными типами роботов для выполнения непредсказуемых сложных задач в разнообразных сценариях. Данная框架 отличается высокой обобщающей способностью, надежностью и эффективностью. Построенная на ее основе прикладная система позволяет значительно улучшить двустороннее понимание намерений между человеком и роботом и снизить порог взаимодействия. Что касается планирования задач для роботов, подавляющее большинство существующих исследований сосредоточено на применении больших моделей в сценариях с единичными задачами и для одного типа роботов. Такие алгоритмы часто обладают сложной структурой и недостаточной обобщающей способностью. Поэтому предложенная框架 LEO-RobotAgent спроектирована с максимально простой структурой, позволяя большим моделям самостоятельно мыслить, планировать и действовать в рамках четкой архитектуры. Мы предоставляем модульный и легко регистрируемый набор инструментов, позволяющий большим моделям гибко использовать различные средства для удовлетворения разнообразных требований. Одновременно框架 включает механизм взаимодействия человека и робота, позволяя алгоритму сотрудничать с человеком как с партнером. Эксперименты подтвердили, что данная框架 может быть легко адаптирована для основных роботизированных платформ, включая беспилотные летательные аппараты (БПЛА), манипуляторы и колесных роботов, и эффективно выполнять тщательно разработанные задачи различного уровня сложности. Наш код доступен по адресу https://github.com/LegendLeoChen/LEO-RobotAgent.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.
PDF63December 17, 2025