AgentFugue : Mise à l'échelle des agents pour les tâches à long horizon par le raisonnement collectif

Résumé

Les progrès récents dans les tâches agentiques à long horizon ont été largement portés par la mise à l'échelle verticale d'agents individuels, via des modèles plus puissants, de meilleurs outils et un échafaudage plus efficace. En revanche, la mise à l'échelle horizontale est beaucoup moins comprise : la question se pose de savoir si de multiples agents pairs, tous ciblant la même tâche, peuvent constituer une source supplémentaire de capacité, sans recourir à une spécialisation explicite des rôles ni à une orchestration des flux de travail. Nous étudions cette question et proposons AgentFugue, un cadre de raisonnement collectif construit autour d'un hub de raisonnement partagé. Tandis que des agents pairs explorent la même tâche en parallèle, le hub enregistre des notes concises sur ce que chaque agent a établi, tenté ou exclu, et permet à chaque agent d'accéder sélectivement aux découvertes des autres sous une forme utile pour sa recherche en cours. Cette conception transforme des trajectoires autrement isolées en une écologie connectée de raisonnements intermédiaires réutilisables, sans nécessiter de planification centralisée. Nous matérialisons le hub sous la forme d'une couche de communication enfichable, entraînée par réglage fin supervisé et apprentissage par renforcement de bout en bout. Sur les configurations exigeantes à long horizon que nous étudions, AgentFugue améliore les performances par rapport à des références solides. Nos résultats suggèrent que le raisonnement collectif peut faire de la mise à l'échelle horizontale des systèmes d'agents pairs une source distincte de gains de capacité, plutôt qu'un simple moyen d'augmenter la puissance de calcul dépensée.

English

Recent progress on long-horizon agentic tasks has been driven largely by scaling up individual agents through stronger models, better tools, and more effective scaffolding. In contrast, much less is understood about scaling out: whether multiple peer agents, all targeting the same task, can become an additional source of capability without relying on explicit role specialization or workflow orchestration. We study this question and propose AgentFugue, a collective reasoning framework built around a shared reasoning hub. As peer agents explore the same task in parallel, the hub records concise notes on what each agent has established, attempted, or ruled out, and enables each agent to selectively access what other agents have discovered in a form useful for its current search. This design turns otherwise isolated trajectories into a connected ecology of reusable intermediate reasoning without requiring centralized planning. We instantiate the hub as a plug-in communication layer, trained with supervised fine-tuning and end-to-end reinforcement learning. Across the challenging long-horizon settings we study, AgentFugue improves over strong baselines. Our results suggest that collective reasoning can turn scaling out peer agent systems into a distinct source of capability gains, rather than merely a way of spending more compute.