HASHIRU: Иерархическая агентная система для гибридного интеллектуального использования ресурсов
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Авторы: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Аннотация
Быстрое развитие крупных языковых моделей (LLM) стимулирует разработку автономных мультиагентных систем (MAS). Однако современные фреймворки часто страдают от недостатка гибкости, осведомленности о ресурсах, разнообразия моделей и автономного создания инструментов. В данной статье представлен HASHIRU (Иерархическая Агентная Система для Гибкого Интеллектуального Использования Ресурсов) — новый фреймворк MAS, который повышает гибкость, эффективность использования ресурсов и адаптивность. HASHIRU включает агента "CEO", который динамически управляет специализированными агентами "сотрудниками", создаваемыми в зависимости от задач и ограничений ресурсов (стоимость, память). Его гибридный интеллект отдает приоритет более компактным локальным LLM (через Ollama), гибко используя внешние API и более крупные модели при необходимости. Экономическая модель с учетом затрат на найм и увольнение способствует стабильности команды и эффективному распределению ресурсов. Система также включает автономное создание инструментов API и функцию памяти. Оценки на задачах, таких как рецензирование научных статей (58% успеха), оценка безопасности (100% на подмножестве JailbreakBench) и сложные рассуждения (превосходя Gemini 2.0 Flash на GSM8K: 96% против 61%; JEEBench: 80% против 68,3%; SVAMP: 92% против 84%), демонстрируют возможности HASHIRU. Кейс-стадии иллюстрируют его самоулучшение через автономную генерацию моделей затрат, интеграцию инструментов и управление бюджетом. HASHIRU предлагает перспективный подход для создания более устойчивых, эффективных и адаптивных MAS благодаря динамическому иерархическому управлению, гибридному интеллекту с учетом ресурсов и автономному функциональному расширению. Исходный код и бенчмарки доступны по адресам https://github.com/HASHIRU-AI/HASHIRU и https://github.com/HASHIRU-AI/HASHIRUBench соответственно, а живая демонстрация доступна по запросу на https://hashiruagentx-hashiruai.hf.space.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.