Automatisierte Komposition von Agenten: Ein Rucksack-Ansatz zur Auswahl agentenbasierter Komponenten
Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
October 18, 2025
papers.authors: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara
cs.AI
papers.abstract
Die Gestaltung effektiver agentischer Systeme erfordert die nahtlose Komposition und Integration von Agenten, Werkzeugen und Modellen in dynamischen und unsicheren Umgebungen. Die meisten bestehenden Methoden verlassen sich auf statische, semantische Retrieval-Ansätze zur Entdeckung von Werkzeugen oder Agenten. Die effektive Wiederverwendung und Komposition bestehender Komponenten bleibt jedoch aufgrund unvollständiger Fähigkeitsbeschreibungen und der Grenzen von Retrieval-Methoden eine Herausforderung. Die Auswahl von Komponenten leidet darunter, dass die Entscheidungen nicht auf Fähigkeiten, Kosten und Echtzeit-Nutzen basieren. Um diese Herausforderungen zu bewältigen, führen wir ein strukturiertes, automatisiertes Framework für die Komposition agentischer Systeme ein, das vom Rucksackproblem inspiriert ist. Unser Framework ermöglicht es einem Komponisten-Agenten, systematisch eine optimale Menge agentischer Komponenten zu identifizieren, auszuwählen und zusammenzusetzen, indem Leistung, Budgetbeschränkungen und Kompatibilität gemeinsam berücksichtigt werden. Durch das dynamische Testen von Kandidatenkomponenten und die Modellierung ihres Nutzens in Echtzeit rationalisiert unser Ansatz die Zusammenstellung agentischer Systeme und erleichtert die skalierbare Wiederverwendung von Ressourcen. Die empirische Auswertung mit Claude 3.5 Sonnet über fünf Benchmarking-Datensätze zeigt, dass unser auf dem Online-Rucksack basierender Komponist konsequent auf der Pareto-Grenze liegt und im Vergleich zu unseren Baselines höhere Erfolgsraten bei deutlich niedrigeren Komponentenkosten erreicht. Im Einzelagenten-Setup zeigt der Online-Rucksack-Komponist eine Verbesserung der Erfolgsrate von bis zu 31,6 % im Vergleich zu den Retrieval-Baselines. In Multi-Agenten-Systemen erhöht der Online-Rucksack-Komponist die Erfolgsrate von 37 % auf 87 %, wenn Agenten aus einem Inventar von über 100 Agenten ausgewählt werden. Die erhebliche Leistungslücke bestätigt die robuste Anpassungsfähigkeit unserer Methode über verschiedene Domänen und Budgetbeschränkungen hinweg.
English
Designing effective agentic systems requires the seamless composition and
integration of agents, tools, and models within dynamic and uncertain
environments. Most existing methods rely on static, semantic retrieval
approaches for tool or agent discovery. However, effective reuse and
composition of existing components remain challenging due to incomplete
capability descriptions and the limitations of retrieval methods. Component
selection suffers because the decisions are not based on capability, cost, and
real-time utility. To address these challenges, we introduce a structured,
automated framework for agentic system composition that is inspired by the
knapsack problem. Our framework enables a composer agent to systematically
identify, select, and assemble an optimal set of agentic components by jointly
considering performance, budget constraints, and compatibility. By dynamically
testing candidate components and modeling their utility in real-time, our
approach streamlines the assembly of agentic systems and facilitates scalable
reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five
benchmarking datasets shows that our online-knapsack-based composer
consistently lies on the Pareto frontier, achieving higher success rates at
significantly lower component costs compared to our baselines. In the
single-agent setup, the online knapsack composer shows a success rate
improvement of up to 31.6% in comparison to the retrieval baselines. In
multi-agent systems, the online knapsack composer increases success rate from
37% to 87% when agents are selected from an agent inventory of 100+ agents. The
substantial performance gap confirms the robust adaptability of our method
across diverse domains and budget constraints.