Composition automatisée d'agents : une approche par sac à dos pour la sélection de composants agentiques
Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
October 18, 2025
papers.authors: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara
cs.AI
papers.abstract
La conception de systèmes agentifs efficaces nécessite la composition et l'intégration fluides d'agents, d'outils et de modèles dans des environnements dynamiques et incertains. La plupart des méthodes existantes reposent sur des approches de récupération sémantique statique pour la découverte d'outils ou d'agents. Cependant, la réutilisation et la composition efficaces des composants existants restent difficiles en raison de descriptions incomplètes des capacités et des limites des méthodes de récupération. La sélection des composants est entravée car les décisions ne sont pas basées sur les capacités, les coûts et l'utilité en temps réel. Pour relever ces défis, nous introduisons un cadre structuré et automatisé pour la composition de systèmes agentifs, inspiré du problème du sac à dos. Notre cadre permet à un agent compositeur d'identifier, de sélectionner et d'assembler systématiquement un ensemble optimal de composants agentifs en prenant en compte conjointement les performances, les contraintes budgétaires et la compatibilité. En testant dynamiquement les composants candidats et en modélisant leur utilité en temps réel, notre approche rationalise l'assemblage des systèmes agentifs et facilite la réutilisation évolutive des ressources. L'évaluation empirique avec Claude 3.5 Sonnet sur cinq ensembles de données de référence montre que notre compositeur basé sur le sac à dos en ligne se situe systématiquement sur la frontière de Pareto, atteignant des taux de réussite plus élevés à des coûts de composants significativement inférieurs par rapport à nos références. Dans le cadre mono-agent, le compositeur basé sur le sac à dos en ligne montre une amélioration du taux de réussite allant jusqu'à 31,6 % par rapport aux références de récupération. Dans les systèmes multi-agents, le compositeur basé sur le sac à dos en ligne augmente le taux de réussite de 37 % à 87 % lorsque les agents sont sélectionnés parmi un inventaire de plus de 100 agents. L'écart de performance substantiel confirme la robuste adaptabilité de notre méthode à travers divers domaines et contraintes budgétaires.
English
Designing effective agentic systems requires the seamless composition and
integration of agents, tools, and models within dynamic and uncertain
environments. Most existing methods rely on static, semantic retrieval
approaches for tool or agent discovery. However, effective reuse and
composition of existing components remain challenging due to incomplete
capability descriptions and the limitations of retrieval methods. Component
selection suffers because the decisions are not based on capability, cost, and
real-time utility. To address these challenges, we introduce a structured,
automated framework for agentic system composition that is inspired by the
knapsack problem. Our framework enables a composer agent to systematically
identify, select, and assemble an optimal set of agentic components by jointly
considering performance, budget constraints, and compatibility. By dynamically
testing candidate components and modeling their utility in real-time, our
approach streamlines the assembly of agentic systems and facilitates scalable
reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five
benchmarking datasets shows that our online-knapsack-based composer
consistently lies on the Pareto frontier, achieving higher success rates at
significantly lower component costs compared to our baselines. In the
single-agent setup, the online knapsack composer shows a success rate
improvement of up to 31.6% in comparison to the retrieval baselines. In
multi-agent systems, the online knapsack composer increases success rate from
37% to 87% when agents are selected from an agent inventory of 100+ agents. The
substantial performance gap confirms the robust adaptability of our method
across diverse domains and budget constraints.