AOrchestra: 에이전트 조정을 위한 하위 에이전트 생성 자동화
AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration
February 3, 2026
저자: Jianhao Ruan, Zhihao Xu, Yiran Peng, Fashen Ren, Zhaoyang Yu, Xinbing Liang, Jinyu Xiang, Bang Liu, Chenglin Wu, Yuyu Luo, Jiayi Zhang
cs.AI
초록
언어 에이전트는 작업 자동화에 강력한 가능성을 보여주고 있습니다. 점점 더 복잡하고 장기적인 작업에 대한 이러한 가능성을 실현하기 위해 다중 턴 작업 해결을 위한 하위 에이전트-도구 패러다임이 부상했습니다. 그러나 기존 설계는 여전히 하위 에이전트에 대한 동적 추상화 뷰가 부족하여 적응성을 저해하고 있습니다. 우리는 이 문제를 해결하기 위해 모든 에이전트를 (지시문, 컨텍스트, 도구, 모델) 튜플로 모델링하는 통일된 프레임워크 독립적 에이전트 추상화를 제안합니다. 이 튜플은 기능에 대한 구성적 레시피 역할을 하여 시스템이 각 작업에 대해 필요에 따라 특화된 실행기를 생성할 수 있게 합니다. 이 추상화를 기반으로 중앙 오케스트레이터가 각 단계에서 튜플을 구체화하는 에이전트 시스템 AOrchestra를 소개합니다. 즉, 오케스트레이터는 작업 관련 컨텍스트를 구성하고, 도구와 모델을 선택하며, 실시간 자동 에이전트 생성을 통해 실행을 위임합니다. 이러한 설계는 인간의 엔지니어링 노력을 줄이고, 다양한 에이전트를 작업 실행기로 플러그 앤 플레이 방식으로 지원함으로써 프레임워크 독립성을 유지합니다. 또한 제어 가능한 성능-비용 절충을 가능하게 하여 시스템이 파레토 효율에 접근할 수 있도록 합니다. 세 가지 까다로운 벤치마크(GAIA, SWE-Bench, Terminal-Bench)에서 AOrchestra는 Gemini-3-Flash와 결합했을 때 가장 강력한 베이스라인 대비 16.28%의 상대적 성능 향상을 달성했습니다. 코드는 https://github.com/FoundationAgents/AOrchestra 에서 확인할 수 있습니다.
English
Language agents have shown strong promise for task automation. Realizing this promise for increasingly complex, long-horizon tasks has driven the rise of a sub-agent-as-tools paradigm for multi-turn task solving. However, existing designs still lack a dynamic abstraction view of sub-agents, thereby hurting adaptability. We address this challenge with a unified, framework-agnostic agent abstraction that models any agent as a tuple Instruction, Context, Tools, Model. This tuple acts as a compositional recipe for capabilities, enabling the system to spawn specialized executors for each task on demand. Building on this abstraction, we introduce an agentic system AOrchestra, where the central orchestrator concretizes the tuple at each step: it curates task-relevant context, selects tools and models, and delegates execution via on-the-fly automatic agent creation. Such designs enable reducing human engineering efforts, and remain framework-agnostic with plug-and-play support for diverse agents as task executors. It also enables a controllable performance-cost trade-off, allowing the system to approach Pareto-efficient. Across three challenging benchmarks (GAIA, SWE-Bench, Terminal-Bench), AOrchestra achieves 16.28% relative improvement against the strongest baseline when paired with Gemini-3-Flash. The code is available at: https://github.com/FoundationAgents/AOrchestra