Des compétences au talent : organiser des agents hétérogènes comme une entreprise réelle
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company
April 24, 2026
Auteurs: Zhengxu Yu, Yu Fu, Zhiyuan He, Yuxuan Huang, Lee Ka Yiu, Meng Fang, Weilin Luo, Jun Wang
cs.AI
Résumé
Les capacités des agents individuels ont progressé rapidement grâce aux compétences modulaires et aux intégrations d'outils, mais les systèmes multi-agents restent contraints par des structures d'équipe fixes, une logique de coordination fortement couplée et un apprentissage lié aux sessions. Nous soutenons que cela reflète une absence plus profonde : une couche organisationnelle principielle qui régit la manière dont une main-d'œuvre d'agents est assemblée, gouvernée et améliorée dans le temps, découplée de ce que les agents individuels savent. Pour combler cette lacune, nous présentons OneManCompany (OMC), un cadre qui élève les systèmes multi-agents au niveau organisationnel. OMC encapsule les compétences, les outils et les configurations d'exécution dans des identités d'agents portables appelées Talents, orchestrées via des interfaces organisationnelles typées qui abstraient les backends hétérogènes. Un marché de Talents communautaire permet un recrutement à la demande, permettant à l'organisation de combler les lacunes de capacités et de se reconfigurer dynamiquement pendant l'exécution. La prise de décision organisationnelle est opérationnalisée via une recherche arborescente Explore-Exécuter-Revue (E²R), qui unifie la planification, l'exécution et l'évaluation dans une boucle hiérarchique unique : les tâches sont décomposées de haut en bas en unités responsables et les résultats d'exécution sont agrégés de bas en haut pour piloter une revue et un raffinement systématiques. Cette boucle offre des garanties formelles sur la terminaison et l'absence d'interblocage tout en reflétant les mécanismes de rétroaction des entreprises humaines. Ensemble, ces contributions transforment les systèmes multi-agents de pipelines statiques préconfigurés en organisations IA auto-organisatrices et auto-améliorantes capables de s'adapter à des tâches ouvertes dans divers domaines. L'évaluation empirique sur PRDBench montre qu'OMC atteint un taux de réussite de 84,67 %, surpassant l'état de l'art de 15,48 points de pourcentage, avec des études de cas interdomaines démontrant davantage sa généralité.
English
Individual agent capabilities have advanced rapidly through modular skills and tool integrations, yet multi-agent systems remain constrained by fixed team structures, tightly coupled coordination logic, and session-bound learning. We argue that this reflects a deeper absence: a principled organisational layer that governs how a workforce of agents is assembled, governed, and improved over time, decoupled from what individual agents know. To fill this gap, we introduce OneManCompany (OMC), a framework that elevates multi-agent systems to the organisational level. OMC encapsulates skills, tools, and runtime configurations into portable agent identities called Talents, orchestrated through typed organisational interfaces that abstract over heterogeneous backends. A community-driven Talent Market enables on-demand recruitment, allowing the organisation to close capability gaps and reconfigure itself dynamically during execution. Organisational decision-making is operationalised through an Explore-Execute-Review (E^2R) tree search, which unifies planning, execution, and evaluation in a single hierarchical loop: tasks are decomposed top-down into accountable units and execution outcomes are aggregated bottom-up to drive systematic review and refinement. This loop provides formal guarantees on termination and deadlock freedom while mirroring the feedback mechanisms of human enterprises. Together, these contributions transform multi-agent systems from static, pre-configured pipelines into self-organising and self-improving AI organisations capable of adapting to open-ended tasks across diverse domains. Empirical evaluation on PRDBench shows that OMC achieves an 84.67% success rate, surpassing the state of the art by 15.48 percentage points, with cross-domain case studies further demonstrating its generality.