スキルから才能へ:現実企業としての多様なエージェント組織化
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company
April 24, 2026
著者: Zhengxu Yu, Yu Fu, Zhiyuan He, Yuxuan Huang, Lee Ka Yiu, Meng Fang, Weilin Luo, Jun Wang
cs.AI
要旨
個々のエージェントの能力は、モジュラー化されたスキルとツール統合によって急速に進化してきた。しかし、マルチエージェントシステムは依然として、固定されたチーム構造、密結合な協調ロジック、セッション限定的な学習によって制約されている。これは、個々のエージェントの知識から分離された形で、エージェント群の編成、統治、改善を体系的に管理する組織層の原理的欠如を反映していると我々は考える。この隔たりを埋めるため、我々はマルチエージェントシステムを組織レベルに昇華するフレームワーク「OneManCompany(OMC)」を提案する。OMCはスキル、ツール、実行時設定を移植可能なエージェント識別子「Talent」としてカプセル化し、異種バックエンドを抽象化した型付き組織インターフェースを通じてオーケストレーションする。コミュニティ駆動型のTalent市場によりオンデマンドな人材調達を可能にし、組織は実行中に能力ギャップを埋めながら動的に自己再構成できる。組織的意思決定はExplore-Execute-Review(E^2R)木探索として具現化され、計画・実行・評価を単一の階層ループに統合する:タスクはトップダウンで責任単位に分解され、実行結果はボトムアップで集約されて体系的なレビューと改善を促進する。このループは終了性とデッドロック回避の形式的保証を提供しつつ、人間組織のフィードバック機制を反映する。これらの貢献により、マルチエージェントシステムは静的な事前設定パイプラインから、多様な領域にわたる未定義タスクに適応可能な自己組織化・自己改善型AI組織へと変容する。PRDBenchによる実証評価では、OMCは84.67%の成功率を達成し、既存手法を15.48ポイント上回り、分野横断的ケーススタディにより汎用性をさらに実証した。
English
Individual agent capabilities have advanced rapidly through modular skills and tool integrations, yet multi-agent systems remain constrained by fixed team structures, tightly coupled coordination logic, and session-bound learning. We argue that this reflects a deeper absence: a principled organisational layer that governs how a workforce of agents is assembled, governed, and improved over time, decoupled from what individual agents know. To fill this gap, we introduce OneManCompany (OMC), a framework that elevates multi-agent systems to the organisational level. OMC encapsulates skills, tools, and runtime configurations into portable agent identities called Talents, orchestrated through typed organisational interfaces that abstract over heterogeneous backends. A community-driven Talent Market enables on-demand recruitment, allowing the organisation to close capability gaps and reconfigure itself dynamically during execution. Organisational decision-making is operationalised through an Explore-Execute-Review (E^2R) tree search, which unifies planning, execution, and evaluation in a single hierarchical loop: tasks are decomposed top-down into accountable units and execution outcomes are aggregated bottom-up to drive systematic review and refinement. This loop provides formal guarantees on termination and deadlock freedom while mirroring the feedback mechanisms of human enterprises. Together, these contributions transform multi-agent systems from static, pre-configured pipelines into self-organising and self-improving AI organisations capable of adapting to open-ended tasks across diverse domains. Empirical evaluation on PRDBench shows that OMC achieves an 84.67% success rate, surpassing the state of the art by 15.48 percentage points, with cross-domain case studies further demonstrating its generality.