ChatPaper.aiChatPaper

Composición Automatizada de Agentes: Un Enfoque de la Mochila para la Selección de Componentes Agénticos

Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection

October 18, 2025
Autores: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara
cs.AI

Resumen

El diseño de sistemas agentes efectivos requiere la composición e integración fluida de agentes, herramientas y modelos dentro de entornos dinámicos e inciertos. La mayoría de los métodos existentes se basan en enfoques estáticos de recuperación semántica para el descubrimiento de herramientas o agentes. Sin embargo, la reutilización y composición efectiva de componentes existentes sigue siendo un desafío debido a descripciones incompletas de capacidades y las limitaciones de los métodos de recuperación. La selección de componentes se ve afectada porque las decisiones no se basan en la capacidad, el costo y la utilidad en tiempo real. Para abordar estos desafíos, presentamos un marco estructurado y automatizado para la composición de sistemas agentes inspirado en el problema de la mochila. Nuestro marco permite a un agente compositor identificar, seleccionar y ensamblar sistemáticamente un conjunto óptimo de componentes agentes considerando conjuntamente el rendimiento, las restricciones presupuestarias y la compatibilidad. Al probar dinámicamente componentes candidatos y modelar su utilidad en tiempo real, nuestro enfoque optimiza el ensamblaje de sistemas agentes y facilita la reutilización escalable de recursos. La evaluación empírica con Claude 3.5 Sonnet en cinco conjuntos de datos de referencia muestra que nuestro compositor basado en la mochila en línea se encuentra consistentemente en la frontera de Pareto, logrando tasas de éxito más altas con costos de componentes significativamente más bajos en comparación con nuestras líneas base. En la configuración de un solo agente, el compositor de mochila en línea muestra una mejora en la tasa de éxito de hasta un 31,6% en comparación con las líneas base de recuperación. En sistemas multiagente, el compositor de mochila en línea aumenta la tasa de éxito del 37% al 87% cuando los agentes se seleccionan de un inventario de más de 100 agentes. La brecha sustancial de rendimiento confirma la robusta adaptabilidad de nuestro método en diversos dominios y restricciones presupuestarias.
English
Designing effective agentic systems requires the seamless composition and integration of agents, tools, and models within dynamic and uncertain environments. Most existing methods rely on static, semantic retrieval approaches for tool or agent discovery. However, effective reuse and composition of existing components remain challenging due to incomplete capability descriptions and the limitations of retrieval methods. Component selection suffers because the decisions are not based on capability, cost, and real-time utility. To address these challenges, we introduce a structured, automated framework for agentic system composition that is inspired by the knapsack problem. Our framework enables a composer agent to systematically identify, select, and assemble an optimal set of agentic components by jointly considering performance, budget constraints, and compatibility. By dynamically testing candidate components and modeling their utility in real-time, our approach streamlines the assembly of agentic systems and facilitates scalable reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five benchmarking datasets shows that our online-knapsack-based composer consistently lies on the Pareto frontier, achieving higher success rates at significantly lower component costs compared to our baselines. In the single-agent setup, the online knapsack composer shows a success rate improvement of up to 31.6% in comparison to the retrieval baselines. In multi-agent systems, the online knapsack composer increases success rate from 37% to 87% when agents are selected from an agent inventory of 100+ agents. The substantial performance gap confirms the robust adaptability of our method across diverse domains and budget constraints.
PDF22October 21, 2025