ChatPaper.aiChatPaper

Automatisierte Komposition von Agenten: Ein Rucksack-Ansatz zur Auswahl agentenbasierter Komponenten

Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection

October 18, 2025
papers.authors: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara
cs.AI

papers.abstract

Die Gestaltung effektiver agentischer Systeme erfordert die nahtlose Komposition und Integration von Agenten, Werkzeugen und Modellen in dynamischen und unsicheren Umgebungen. Die meisten bestehenden Methoden verlassen sich auf statische, semantische Retrieval-Ansätze zur Entdeckung von Werkzeugen oder Agenten. Die effektive Wiederverwendung und Komposition bestehender Komponenten bleibt jedoch aufgrund unvollständiger Fähigkeitsbeschreibungen und der Grenzen von Retrieval-Methoden eine Herausforderung. Die Auswahl von Komponenten leidet darunter, dass die Entscheidungen nicht auf Fähigkeiten, Kosten und Echtzeit-Nutzen basieren. Um diese Herausforderungen zu bewältigen, führen wir ein strukturiertes, automatisiertes Framework für die Komposition agentischer Systeme ein, das vom Rucksackproblem inspiriert ist. Unser Framework ermöglicht es einem Komponisten-Agenten, systematisch eine optimale Menge agentischer Komponenten zu identifizieren, auszuwählen und zusammenzusetzen, indem Leistung, Budgetbeschränkungen und Kompatibilität gemeinsam berücksichtigt werden. Durch das dynamische Testen von Kandidatenkomponenten und die Modellierung ihres Nutzens in Echtzeit rationalisiert unser Ansatz die Zusammenstellung agentischer Systeme und erleichtert die skalierbare Wiederverwendung von Ressourcen. Die empirische Auswertung mit Claude 3.5 Sonnet über fünf Benchmarking-Datensätze zeigt, dass unser auf dem Online-Rucksack basierender Komponist konsequent auf der Pareto-Grenze liegt und im Vergleich zu unseren Baselines höhere Erfolgsraten bei deutlich niedrigeren Komponentenkosten erreicht. Im Einzelagenten-Setup zeigt der Online-Rucksack-Komponist eine Verbesserung der Erfolgsrate von bis zu 31,6 % im Vergleich zu den Retrieval-Baselines. In Multi-Agenten-Systemen erhöht der Online-Rucksack-Komponist die Erfolgsrate von 37 % auf 87 %, wenn Agenten aus einem Inventar von über 100 Agenten ausgewählt werden. Die erhebliche Leistungslücke bestätigt die robuste Anpassungsfähigkeit unserer Methode über verschiedene Domänen und Budgetbeschränkungen hinweg.
English
Designing effective agentic systems requires the seamless composition and integration of agents, tools, and models within dynamic and uncertain environments. Most existing methods rely on static, semantic retrieval approaches for tool or agent discovery. However, effective reuse and composition of existing components remain challenging due to incomplete capability descriptions and the limitations of retrieval methods. Component selection suffers because the decisions are not based on capability, cost, and real-time utility. To address these challenges, we introduce a structured, automated framework for agentic system composition that is inspired by the knapsack problem. Our framework enables a composer agent to systematically identify, select, and assemble an optimal set of agentic components by jointly considering performance, budget constraints, and compatibility. By dynamically testing candidate components and modeling their utility in real-time, our approach streamlines the assembly of agentic systems and facilitates scalable reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five benchmarking datasets shows that our online-knapsack-based composer consistently lies on the Pareto frontier, achieving higher success rates at significantly lower component costs compared to our baselines. In the single-agent setup, the online knapsack composer shows a success rate improvement of up to 31.6% in comparison to the retrieval baselines. In multi-agent systems, the online knapsack composer increases success rate from 37% to 87% when agents are selected from an agent inventory of 100+ agents. The substantial performance gap confirms the robust adaptability of our method across diverse domains and budget constraints.
PDF22October 21, 2025