HASHIRU: Hiërarchisch Agentsysteem voor Hybride Intelligent Resourcegebruik
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Auteurs: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Samenvatting
Snelle vooruitgang in Large Language Models (LLM's) stimuleert de ontwikkeling van autonome Multi-Agent Systemen (MAS). Huidige frameworks missen echter vaak flexibiliteit, resourcebewustzijn, modeldiversiteit en autonome toolcreatie. Dit artikel introduceert HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), een nieuw MAS-framework dat flexibiliteit, resource-efficiëntie en aanpassingsvermogen verbetert. HASHIRU beschikt over een "CEO"-agent die gespecialiseerde "werknemer"-agenten dynamisch beheert, geïnstantieerd op basis van taakbehoeften en resourcebeperkingen (kosten, geheugen). De hybride intelligentie geeft prioriteit aan kleinere, lokale LLM's (via Ollama) terwijl het flexibel externe API's en grotere modellen gebruikt wanneer nodig. Een economisch model met aanwervings-/ontslagkosten bevordert teamstabiliteit en efficiënte resourceallocatie. Het systeem omvat ook autonome API-toolcreatie en een geheugenfunctie. Evaluaties van taken zoals academische paperreview (58% succes), veiligheidsbeoordelingen (100% op een JailbreakBench-subset) en complex redeneren (beter presterend dan Gemini 2.0 Flash op GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstreren de mogelijkheden van HASHIRU. Casestudies illustreren de zelfverbetering via autonome kostenmodelgeneratie, toolintegratie en budgetbeheer. HASHIRU biedt een veelbelovende aanpak voor robuustere, efficiëntere en aanpasbaardere MAS door dynamische hiërarchische controle, resourcebewuste hybride intelligentie en autonome functionele uitbreiding. Broncode en benchmarks zijn beschikbaar op https://github.com/HASHIRU-AI/HASHIRU en https://github.com/HASHIRU-AI/HASHIRUBench respectievelijk, en een live demo is beschikbaar op https://hashiruagentx-hashiruai.hf.space op verzoek.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.