ChatPaper.aiChatPaper

HASHIRU: Sistema de Agentes Jerárquicos para la Utilización Híbrida e Inteligente de Recursos

HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

June 1, 2025
Autores: Kunal Pai, Parth Shah, Harshil Patel
cs.AI

Resumen

Los rápidos avances en los Modelos de Lenguaje de Gran Escala (LLM, por sus siglas en inglés) están impulsando el desarrollo de Sistemas Multiagente (MAS, por sus siglas en inglés) autónomos. Sin embargo, los marcos actuales a menudo carecen de flexibilidad, conciencia de recursos, diversidad de modelos y creación autónoma de herramientas. Este artículo presenta HASHIRU (Sistema Jerárquico de Agentes para la Utilización Híbrida de Recursos Inteligentes), un novedoso marco MAS que mejora la flexibilidad, eficiencia de recursos y adaptabilidad. HASHIRU incluye un agente "CEO" que gestiona dinámicamente agentes especializados "empleados", instanciados según las necesidades de la tarea y las restricciones de recursos (costo, memoria). Su inteligencia híbrida prioriza modelos LLM más pequeños y locales (a través de Ollama) mientras utiliza de manera flexible APIs externas y modelos más grandes cuando es necesario. Un modelo económico con costos de contratación/despido promueve la estabilidad del equipo y la asignación eficiente de recursos. El sistema también incluye la creación autónoma de herramientas API y una función de memoria. Las evaluaciones en tareas como la revisión de artículos académicos (58% de éxito), evaluaciones de seguridad (100% en un subconjunto de JailbreakBench) y razonamiento complejo (superando a Gemini 2.0 Flash en GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demuestran las capacidades de HASHIRU. Estudios de caso ilustran su automejora mediante la generación autónoma de modelos de costos, integración de herramientas y gestión de presupuestos. HASHIRU ofrece un enfoque prometedor para MAS más robustos, eficientes y adaptables a través del control jerárquico dinámico, la inteligencia híbrida consciente de recursos y la extensión funcional autónoma. El código fuente y los puntos de referencia están disponibles en https://github.com/HASHIRU-AI/HASHIRU y https://github.com/HASHIRU-AI/HASHIRUBench respectivamente, y una demostración en vivo está disponible en https://hashiruagentx-hashiruai.hf.space bajo solicitud.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous Multi-Agent System (MAS) development. However, current frameworks often lack flexibility, resource awareness, model diversity, and autonomous tool creation. This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), a novel MAS framework enhancing flexibility, resource efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically managing specialized "employee" agents, instantiated based on task needs and resource constraints (cost, memory). Its hybrid intelligence prioritizes smaller, local LLMs (via Ollama) while flexibly using external APIs and larger models when necessary. An economic model with hiring/firing costs promotes team stability and efficient resource allocation. The system also includes autonomous API tool creation and a memory function. Evaluations on tasks like academic paper review (58% success), safety assessments (100% on a JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate HASHIRU's capabilities. Case studies illustrate its self-improvement via autonomous cost model generation, tool integration, and budget management. HASHIRU offers a promising approach for more robust, efficient, and adaptable MAS through dynamic hierarchical control, resource-aware hybrid intelligence, and autonomous functional extension. Source code and benchmarks are available at https://github.com/HASHIRU-AI/HASHIRU and https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is available at https://hashiruagentx-hashiruai.hf.space upon request.
PDF52June 9, 2025