HASHIRU: Sistema de Agentes Jerárquicos para la Utilización Híbrida e Inteligente de Recursos
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Autores: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Resumen
Los rápidos avances en los Modelos de Lenguaje de Gran Escala (LLM, por sus siglas en inglés) están impulsando el desarrollo de Sistemas Multiagente (MAS, por sus siglas en inglés) autónomos. Sin embargo, los marcos actuales a menudo carecen de flexibilidad, conciencia de recursos, diversidad de modelos y creación autónoma de herramientas. Este artículo presenta HASHIRU (Sistema Jerárquico de Agentes para la Utilización Híbrida de Recursos Inteligentes), un novedoso marco MAS que mejora la flexibilidad, eficiencia de recursos y adaptabilidad. HASHIRU incluye un agente "CEO" que gestiona dinámicamente agentes especializados "empleados", instanciados según las necesidades de la tarea y las restricciones de recursos (costo, memoria). Su inteligencia híbrida prioriza modelos LLM más pequeños y locales (a través de Ollama) mientras utiliza de manera flexible APIs externas y modelos más grandes cuando es necesario. Un modelo económico con costos de contratación/despido promueve la estabilidad del equipo y la asignación eficiente de recursos. El sistema también incluye la creación autónoma de herramientas API y una función de memoria. Las evaluaciones en tareas como la revisión de artículos académicos (58% de éxito), evaluaciones de seguridad (100% en un subconjunto de JailbreakBench) y razonamiento complejo (superando a Gemini 2.0 Flash en GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demuestran las capacidades de HASHIRU. Estudios de caso ilustran su automejora mediante la generación autónoma de modelos de costos, integración de herramientas y gestión de presupuestos. HASHIRU ofrece un enfoque prometedor para MAS más robustos, eficientes y adaptables a través del control jerárquico dinámico, la inteligencia híbrida consciente de recursos y la extensión funcional autónoma. El código fuente y los puntos de referencia están disponibles en https://github.com/HASHIRU-AI/HASHIRU y https://github.com/HASHIRU-AI/HASHIRUBench respectivamente, y una demostración en vivo está disponible en https://hashiruagentx-hashiruai.hf.space bajo solicitud.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.