HASHIRU : Système d'Agents Hiérarchique pour l'Utilisation Hybride Intelligente des Ressources

papers.abstract

Les avancées rapides des modèles de langage de grande taille (LLM) stimulent le développement des systèmes multi-agents (MAS) autonomes. Cependant, les cadres actuels manquent souvent de flexibilité, de conscience des ressources, de diversité de modèles et de création autonome d'outils. Cet article présente HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), un nouveau cadre MAS qui améliore la flexibilité, l'efficacité des ressources et l'adaptabilité. HASHIRU intègre un agent "PDG" gérant dynamiquement des agents spécialisés "employés", instanciés en fonction des besoins des tâches et des contraintes de ressources (coût, mémoire). Son intelligence hybride privilégie les LLM plus petits et locaux (via Ollama) tout en utilisant de manière flexible des API externes et des modèles plus grands lorsque nécessaire. Un modèle économique avec des coûts d'embauche/licenciement favorise la stabilité de l'équipe et l'allocation efficace des ressources. Le système inclut également une création autonome d'outils API et une fonction de mémoire. Les évaluations sur des tâches telles que la revue d'articles académiques (58 % de réussite), les évaluations de sécurité (100 % sur un sous-ensemble de JailbreakBench) et le raisonnement complexe (surpassant Gemini 2.0 Flash sur GSM8K : 96 % contre 61 % ; JEEBench : 80 % contre 68,3 % ; SVAMP : 92 % contre 84 %) démontrent les capacités de HASHIRU. Des études de cas illustrent son auto-amélioration via la génération autonome de modèles de coûts, l'intégration d'outils et la gestion budgétaire. HASHIRU propose une approche prometteuse pour des MAS plus robustes, efficaces et adaptables grâce à un contrôle hiérarchique dynamique, une intelligence hybride consciente des ressources et une extension fonctionnelle autonome. Le code source et les benchmarks sont disponibles respectivement sur https://github.com/HASHIRU-AI/HASHIRU et https://github.com/HASHIRU-AI/HASHIRUBench, et une démonstration en direct est accessible sur https://hashiruagentx-hashiruai.hf.space sur demande.

English

Rapid Large Language Model (LLM) advancements are fueling autonomous Multi-Agent System (MAS) development. However, current frameworks often lack flexibility, resource awareness, model diversity, and autonomous tool creation. This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), a novel MAS framework enhancing flexibility, resource efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically managing specialized "employee" agents, instantiated based on task needs and resource constraints (cost, memory). Its hybrid intelligence prioritizes smaller, local LLMs (via Ollama) while flexibly using external APIs and larger models when necessary. An economic model with hiring/firing costs promotes team stability and efficient resource allocation. The system also includes autonomous API tool creation and a memory function. Evaluations on tasks like academic paper review (58% success), safety assessments (100% on a JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate HASHIRU's capabilities. Case studies illustrate its self-improvement via autonomous cost model generation, tool integration, and budget management. HASHIRU offers a promising approach for more robust, efficient, and adaptable MAS through dynamic hierarchical control, resource-aware hybrid intelligence, and autonomous functional extension. Source code and benchmarks are available at https://github.com/HASHIRU-AI/HASHIRU and https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is available at https://hashiruagentx-hashiruai.hf.space upon request.

HASHIRU : Système d'Agents Hiérarchique pour l'Utilisation Hybride Intelligente des Ressources

HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

papers.abstract

Support