Dalle Competenze al Talento: Organizzare Agenti Eterogenei come un'Azienda del Mondo Reale
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company
April 24, 2026
Autori: Zhengxu Yu, Yu Fu, Zhiyuan He, Yuxuan Huang, Lee Ka Yiu, Meng Fang, Weilin Luo, Jun Wang
cs.AI
Abstract
Le capacità dei singoli agenti sono progredite rapidamente grazie a competenze modulari e integrazioni di strumenti, tuttavia i sistemi multi-agente rimangono limitati da strutture di team fissi, logiche di coordinamento strettamente accoppiate e apprendimento vincolato alla sessione. Sosteniamo che ciò rifletta un'assenza più profonda: un livello organizzativo principiato che governa come una forza lavoro di agenti viene assemblata, governata e migliorata nel tempo, disaccoppiata da ciò che i singoli agenti conoscono. Per colmare questa lacuna, introduciamo OneManCompany (OMC), un framework che eleva i sistemi multi-agente al livello organizzativo. OMC incapsula competenze, strumenti e configurazioni di runtime in identità agenti portabili chiamate Talent, orchestrate attraverso interfacce organizzative tipate che astraggono da backend eterogenei. Un Talent Market guidato dalla comunità abilita un reclutamento on-demand, consentendo all'organizzazione di colmare lacune di capacità e riconfigurarsi dinamicamente durante l'esecuzione. La decisione organizzativa è operazionalizzata attraverso una ricerca ad albero Esplora-Esegui-Rivedi (E²R), che unifica pianificazione, esecuzione e valutazione in un unico ciclo gerarchico: i compiti sono scomposti top-down in unità responsabili e i risultati dell'esecuzione sono aggregati bottom-up per guidare una revisione e un affinamento sistematici. Questo ciclo fornisce garanzie formali su terminazione e libertà da deadlock, rispecchiando al contempo i meccanismi di feedback delle imprese umane. Insieme, questi contributi trasformano i sistemi multi-agente da pipeline statiche e preconfigurate in organizzazioni di IA auto-organizzanti e auto-miglioranti, in grado di adattarsi a compiti aperti in diversi domini. La valutazione empirica su PRDBench mostra che OMC raggiunge un tasso di successo dell'84,67%, superando lo stato dell'arte di 15,48 punti percentuali, con studi di caso cross-dominio che ne dimostrano ulteriormente la generalità.
English
Individual agent capabilities have advanced rapidly through modular skills and tool integrations, yet multi-agent systems remain constrained by fixed team structures, tightly coupled coordination logic, and session-bound learning. We argue that this reflects a deeper absence: a principled organisational layer that governs how a workforce of agents is assembled, governed, and improved over time, decoupled from what individual agents know. To fill this gap, we introduce OneManCompany (OMC), a framework that elevates multi-agent systems to the organisational level. OMC encapsulates skills, tools, and runtime configurations into portable agent identities called Talents, orchestrated through typed organisational interfaces that abstract over heterogeneous backends. A community-driven Talent Market enables on-demand recruitment, allowing the organisation to close capability gaps and reconfigure itself dynamically during execution. Organisational decision-making is operationalised through an Explore-Execute-Review (E^2R) tree search, which unifies planning, execution, and evaluation in a single hierarchical loop: tasks are decomposed top-down into accountable units and execution outcomes are aggregated bottom-up to drive systematic review and refinement. This loop provides formal guarantees on termination and deadlock freedom while mirroring the feedback mechanisms of human enterprises. Together, these contributions transform multi-agent systems from static, pre-configured pipelines into self-organising and self-improving AI organisations capable of adapting to open-ended tasks across diverse domains. Empirical evaluation on PRDBench shows that OMC achieves an 84.67% success rate, surpassing the state of the art by 15.48 percentage points, with cross-domain case studies further demonstrating its generality.