Van Vaardigheden naar Talent: Het Organiseren van Heterogene Agenten als een Real-World Bedrijf
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company
April 24, 2026
Auteurs: Zhengxu Yu, Yu Fu, Zhiyuan He, Yuxuan Huang, Lee Ka Yiu, Meng Fang, Weilin Luo, Jun Wang
cs.AI
Samenvatting
Hoewel de mogelijkheden van individuele agents snel zijn gevorderd door modulaire vaardigheden en toolintegraties, worden multi-agent systemen nog steeds beperkt door vaste teamstructuren, sterk gekoppelde coördinatielogica en sessiegebonden leren. Wij stellen dat dit een dieperliggende afwezigheid weerspiegelt: een principieel organisatielaag die bepaalt hoe een werkkracht van agents wordt samengesteld, bestuurd en verbeterd over tijd, losgekoppeld van wat individuele agents weten. Om deze leemte op te vullen, introduceren wij OneManCompany (OMC), een raamwerk dat multi-agent systemen verheft naar het organisatieniveau. OMC verpakt vaardigheden, tools en runtime-configuraties in draagbare agentidentiteiten, Talenten genaamd, die worden georkestreerd via getypeerde organisatorische interfaces die abstractie bieden boven heterogene backends. Een gemeenschapsgedreven Talentenmarkt maakt recruitment op aanvraag mogelijk, waardoor de organisatie in staat is om capaciteitshiaten te dichten en zichzelf dynamisch te herconfigureren tijdens uitvoering. Organisatorische besluitvorming wordt geoperationaliseerd via een Explore-Execute-Review (E²R) boomzoekactie, die planning, uitvoering en evaluatie verenigt in een enkele hiërarchische lus: taken worden van boven naar beneden afgebroken in verantwoordelijke eenheden en uitvoeringsresultaten worden van onder naar boven geaggregeerd om systematische review en verfijning aan te sturen. Deze lus biedt formele garanties voor beëindiging en deadlockvrijheid, terwijl ze de feedbackmechanismen van menselijke ondernemingen weerspiegelt. Gezamenlijk transformeren deze bijdragen multi-agent systemen van statische, vooraf geconfigureerde pijplijnen naar zelforganiserende en zelfverbeterende AI-organisaties die in staat zijn zich aan te passen aan open-ended taken in diverse domeinen. Empirische evaluatie op PRDBench toont aan dat OMC een slagingspercentage van 84,67% behaalt, wat de state-of-the-art met 15,48 procentpunten overtreft, waarbij casestudies across domeinen de generaliseerbaarheid verder aantonen.
English
Individual agent capabilities have advanced rapidly through modular skills and tool integrations, yet multi-agent systems remain constrained by fixed team structures, tightly coupled coordination logic, and session-bound learning. We argue that this reflects a deeper absence: a principled organisational layer that governs how a workforce of agents is assembled, governed, and improved over time, decoupled from what individual agents know. To fill this gap, we introduce OneManCompany (OMC), a framework that elevates multi-agent systems to the organisational level. OMC encapsulates skills, tools, and runtime configurations into portable agent identities called Talents, orchestrated through typed organisational interfaces that abstract over heterogeneous backends. A community-driven Talent Market enables on-demand recruitment, allowing the organisation to close capability gaps and reconfigure itself dynamically during execution. Organisational decision-making is operationalised through an Explore-Execute-Review (E^2R) tree search, which unifies planning, execution, and evaluation in a single hierarchical loop: tasks are decomposed top-down into accountable units and execution outcomes are aggregated bottom-up to drive systematic review and refinement. This loop provides formal guarantees on termination and deadlock freedom while mirroring the feedback mechanisms of human enterprises. Together, these contributions transform multi-agent systems from static, pre-configured pipelines into self-organising and self-improving AI organisations capable of adapting to open-ended tasks across diverse domains. Empirical evaluation on PRDBench shows that OMC achieves an 84.67% success rate, surpassing the state of the art by 15.48 percentage points, with cross-domain case studies further demonstrating its generality.