ChatPaper.aiChatPaper

Composizione Automatica di Agenti: Un Approccio di Zaino per la Selezione di Componenti Agenti

Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection

October 18, 2025
Autori: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara
cs.AI

Abstract

Progettare sistemi agentivi efficaci richiede la composizione e l'integrazione senza soluzione di continuità di agenti, strumenti e modelli all'interno di ambienti dinamici e incerti. La maggior parte dei metodi esistenti si basa su approcci statici di recupero semantico per la scoperta di strumenti o agenti. Tuttavia, il riutilizzo e la composizione efficaci dei componenti esistenti rimangono impegnativi a causa di descrizioni incomplete delle capacità e dei limiti dei metodi di recupero. La selezione dei componenti è compromessa poiché le decisioni non si basano su capacità, costo e utilità in tempo reale. Per affrontare queste sfide, introduciamo un framework strutturato e automatizzato per la composizione di sistemi agentivi, ispirato al problema dello zaino. Il nostro framework consente a un agente compositore di identificare, selezionare e assemblare in modo sistematico un insieme ottimale di componenti agentivi, considerando congiuntamente prestazioni, vincoli di budget e compatibilità. Testando dinamicamente i componenti candidati e modellando la loro utilità in tempo reale, il nostro approccio semplifica l'assemblaggio di sistemi agentivi e facilita il riutilizzo scalabile delle risorse. La valutazione empirica con Claude 3.5 Sonnet su cinque dataset di benchmark dimostra che il nostro compositore basato sullo zaino online si colloca costantemente sulla frontiera di Pareto, raggiungendo tassi di successo più elevati a costi dei componenti significativamente inferiori rispetto ai nostri baseline. Nella configurazione a singolo agente, il compositore basato sullo zaino online mostra un miglioramento del tasso di successo fino al 31,6% rispetto ai baseline di recupero. Nei sistemi multi-agente, il compositore basato sullo zaino online aumenta il tasso di successo dal 37% all'87% quando gli agenti vengono selezionati da un inventario di oltre 100 agenti. Il divario prestazionale sostanziale conferma la robusta adattabilità del nostro metodo in diversi domini e vincoli di budget.
English
Designing effective agentic systems requires the seamless composition and integration of agents, tools, and models within dynamic and uncertain environments. Most existing methods rely on static, semantic retrieval approaches for tool or agent discovery. However, effective reuse and composition of existing components remain challenging due to incomplete capability descriptions and the limitations of retrieval methods. Component selection suffers because the decisions are not based on capability, cost, and real-time utility. To address these challenges, we introduce a structured, automated framework for agentic system composition that is inspired by the knapsack problem. Our framework enables a composer agent to systematically identify, select, and assemble an optimal set of agentic components by jointly considering performance, budget constraints, and compatibility. By dynamically testing candidate components and modeling their utility in real-time, our approach streamlines the assembly of agentic systems and facilitates scalable reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five benchmarking datasets shows that our online-knapsack-based composer consistently lies on the Pareto frontier, achieving higher success rates at significantly lower component costs compared to our baselines. In the single-agent setup, the online knapsack composer shows a success rate improvement of up to 31.6% in comparison to the retrieval baselines. In multi-agent systems, the online knapsack composer increases success rate from 37% to 87% when agents are selected from an agent inventory of 100+ agents. The substantial performance gap confirms the robust adaptability of our method across diverse domains and budget constraints.
PDF22October 21, 2025