LEO-RobotAgent: 언어 기반 구현 운영을 위한 범용 로봇 에이전트
LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator
December 11, 2025
저자: Lihuang Chen, Xiangyu Luo, Jun Meng
cs.AI
초록
본 논문에서는 로봇을 위한 범용 언어 기반 지능형 에이전트 프레임워크인 LEO-RobotAgent를 제안한다. 본 프레임워크 하에서 대규모 언어 모델(LLM)은 다양한 시나리오에서 예측 불가능한 복잡한 임무를 수행하기 위해 서로 다른 유형의 로봇들을 운용할 수 있다. 이 프레임워크는 강력한 일반화 성능, 강건성 및 효율성을 특징으로 한다. 이를 기반으로 구축된 응용 수준의 시스템은 양방향 인간-로봇 의도 이해를 완전히 향상시키고 인간-로봇 상호작용의 진입 장벽을 낮출 수 있다.
로봇 임무 계획 분야와 관련하여, 기존 연구의 대부분은 단일 임무 시나리오 및 단일 로봇 유형에 대한 대형 모델의 적용에 집중되어 있다. 해당 알고리즘들은 종종 복잡한 구조를 가지며 일반화 능력이 부족하다. 이에 따라, 제안된 LEO-RobotAgent 프레임워크는 가능한 한 간결한 구조로 설계되어 대형 모델이 이 명확한 프레임워크 내에서 독립적으로 사고, 계획, 행동할 수 있도록 한다. 우리는 모듈화되고 쉽게 등록 가능한 도구 세트를 제공하여 대형 모델이 다양한 요구 사항을 충족시키기 위해 유연하게 여러 도구들을 호출할 수 있게 한다. 동시에 본 프레임워크는 인간-로봇 상호작용 메커니즘을 통합하여 알고리즘이 인간과 파트너처럼 협업할 수 있도록 한다.
실험을 통해 본 프레임워크가 무인 항공기(UAV), 로봇 팔, 주행 로봇을 포함한 주류 로봇 플랫폼에 쉽게 적용될 수 있으며, 다양한 복잡도를 가진 정교하게 설계된 임무들을 효율적으로 수행할 수 있음이 검증되었다. 우리의 코드는 https://github.com/LegendLeoChen/LEO-RobotAgent에서 확인할 수 있다.
English
We propose LEO-RobotAgent, a general-purpose language-driven intelligent agent framework for robots. Under this framework, LLMs can operate different types of robots to complete unpredictable complex tasks across various scenarios. This framework features strong generalization, robustness, and efficiency. The application-level system built around it can fully enhance bidirectional human-robot intent understanding and lower the threshold for human-robot interaction. Regarding robot task planning, the vast majority of existing studies focus on the application of large models in single-task scenarios and for single robot types. These algorithms often have complex structures and lack generalizability. Thus, the proposed LEO-RobotAgent framework is designed with a streamlined structure as much as possible, enabling large models to independently think, plan, and act within this clear framework. We provide a modular and easily registrable toolset, allowing large models to flexibly call various tools to meet different requirements. Meanwhile, the framework incorporates a human-robot interaction mechanism, enabling the algorithm to collaborate with humans like a partner. Experiments have verified that this framework can be easily adapted to mainstream robot platforms including unmanned aerial vehicles (UAVs), robotic arms, and wheeled robot, and efficiently execute a variety of carefully designed tasks with different complexity levels. Our code is available at https://github.com/LegendLeoChen/LEO-RobotAgent.