HASHIRU: Sistema Agente Gerarchico per l'Utilizzo Intelligente Ibrido delle Risorse
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Autori: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Abstract
I rapidi progressi nei Large Language Model (LLM) stanno alimentando lo sviluppo di sistemi multi-agente (MAS) autonomi. Tuttavia, gli attuali framework spesso mancano di flessibilità, consapevolezza delle risorse, diversità dei modelli e creazione autonoma di strumenti. Questo articolo introduce HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), un nuovo framework MAS che migliora flessibilità, efficienza delle risorse e adattabilità. HASHIRU include un agente "CEO" che gestisce dinamicamente agenti specializzati "dipendenti", istanziati in base alle esigenze del task e ai vincoli di risorse (costo, memoria). La sua intelligenza ibrida privilegia LLM più piccoli e locali (tramite Ollama) utilizzando in modo flessibile API esterne e modelli più grandi quando necessario. Un modello economico con costi di assunzione/licenziamento promuove la stabilità del team e un'allocazione efficiente delle risorse. Il sistema include anche la creazione autonoma di strumenti API e una funzione di memoria. Le valutazioni su task come la revisione di articoli accademici (58% di successo), valutazioni di sicurezza (100% su un sottoinsieme di JailbreakBench) e ragionamento complesso (superando Gemini 2.0 Flash su GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) dimostrano le capacità di HASHIRU. Studi di caso illustrano il suo miglioramento autonomo tramite generazione di modelli di costo, integrazione di strumenti e gestione del budget. HASHIRU offre un approccio promettente per MAS più robusti, efficienti e adattabili attraverso controllo gerarchico dinamico, intelligenza ibrida consapevole delle risorse ed estensione funzionale autonoma. Il codice sorgente e i benchmark sono disponibili rispettivamente su https://github.com/HASHIRU-AI/HASHIRU e https://github.com/HASHIRU-AI/HASHIRUBench, e una demo live è disponibile su https://hashiruagentx-hashiruai.hf.space su richiesta.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.