HASHIRU : Système d'Agents Hiérarchique pour l'Utilisation Hybride Intelligente des Ressources
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Auteurs: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Résumé
Les avancées rapides des modèles de langage de grande taille (LLM) stimulent le développement des systèmes multi-agents (MAS) autonomes. Cependant, les cadres actuels manquent souvent de flexibilité, de conscience des ressources, de diversité de modèles et de création autonome d'outils. Cet article présente HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), un nouveau cadre MAS qui améliore la flexibilité, l'efficacité des ressources et l'adaptabilité. HASHIRU intègre un agent "PDG" gérant dynamiquement des agents spécialisés "employés", instanciés en fonction des besoins des tâches et des contraintes de ressources (coût, mémoire). Son intelligence hybride privilégie les LLM plus petits et locaux (via Ollama) tout en utilisant de manière flexible des API externes et des modèles plus grands lorsque nécessaire. Un modèle économique avec des coûts d'embauche/licenciement favorise la stabilité de l'équipe et l'allocation efficace des ressources. Le système inclut également une création autonome d'outils API et une fonction de mémoire. Les évaluations sur des tâches telles que la revue d'articles académiques (58 % de réussite), les évaluations de sécurité (100 % sur un sous-ensemble de JailbreakBench) et le raisonnement complexe (surpassant Gemini 2.0 Flash sur GSM8K : 96 % contre 61 % ; JEEBench : 80 % contre 68,3 % ; SVAMP : 92 % contre 84 %) démontrent les capacités de HASHIRU. Des études de cas illustrent son auto-amélioration via la génération autonome de modèles de coûts, l'intégration d'outils et la gestion budgétaire. HASHIRU propose une approche prometteuse pour des MAS plus robustes, efficaces et adaptables grâce à un contrôle hiérarchique dynamique, une intelligence hybride consciente des ressources et une extension fonctionnelle autonome. Le code source et les benchmarks sont disponibles respectivement sur https://github.com/HASHIRU-AI/HASHIRU et https://github.com/HASHIRU-AI/HASHIRUBench, et une démonstration en direct est accessible sur https://hashiruagentx-hashiruai.hf.space sur demande.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.