LEO-RobotAgent:言語駆動型身体性オペレータのための汎用ロボットエージェント
LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator
December 11, 2025
著者: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI
要旨
我々は、ロボットのための汎用言語駆動型知的エージェントフレームワーク「LEO-RobotAgent」を提案する。本フレームワークにより、大規模言語モデル(LLM)が様々なタイプのロボットを操作し、多岐にわたるシナリオで予測不能な複雑なタスクを完遂することが可能となる。このフレームワークは、強力な汎化性能、ロバスト性、効率性を特徴とする。これを核として構築されたアプリケーションレベルのシステムは、双方向の人間-ロボット意図理解を大幅に強化し、人間-ロボットインタラクションの参入障壁を低減することができる。
ロボットタスク計画に関して、既存研究の大半は単一タスクシナリオおよび単一ロボットタイプにおける大規模モデルの応用に焦点を当てている。これらのアルゴリズムは往々にして複雑な構造を持ち、汎用性に欠ける。そこで、提案するLEO-RobotAgentフレームワークは、可能な限り簡素化された構造で設計されており、大規模モデルがこの明確な枠組み内で自律的に思考、計画、行動することを可能にする。我々はモジュール化され容易に登録可能なツールセットを提供し、大規模モデルが様々な要件に対応するために柔軟にツールを呼び出せるようにした。同時に、フレームワークには人間-ロボットインタラクション機構が組み込まれており、アルゴリズムが人間のパートナーのように協働することが可能である。
実験により、本フレームワークが無人航空機(UAV)、ロボットアーム、車輪型ロボットを含む主流のロボットプラットフォームに容易に適応し、複雑さの異なる様々に工夫を凝らしたタスクを効率的に実行できることが検証された。コードはhttps://github.com/LegendLeoChen/LEO-RobotAgent で公開している。
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.