HASHIRU: Иерархическая агентная система для гибридного интеллектуального использования ресурсов

Аннотация

Быстрое развитие крупных языковых моделей (LLM) стимулирует разработку автономных мультиагентных систем (MAS). Однако современные фреймворки часто страдают от недостатка гибкости, осведомленности о ресурсах, разнообразия моделей и автономного создания инструментов. В данной статье представлен HASHIRU (Иерархическая Агентная Система для Гибкого Интеллектуального Использования Ресурсов) — новый фреймворк MAS, который повышает гибкость, эффективность использования ресурсов и адаптивность. HASHIRU включает агента "CEO", который динамически управляет специализированными агентами "сотрудниками", создаваемыми в зависимости от задач и ограничений ресурсов (стоимость, память). Его гибридный интеллект отдает приоритет более компактным локальным LLM (через Ollama), гибко используя внешние API и более крупные модели при необходимости. Экономическая модель с учетом затрат на найм и увольнение способствует стабильности команды и эффективному распределению ресурсов. Система также включает автономное создание инструментов API и функцию памяти. Оценки на задачах, таких как рецензирование научных статей (58% успеха), оценка безопасности (100% на подмножестве JailbreakBench) и сложные рассуждения (превосходя Gemini 2.0 Flash на GSM8K: 96% против 61%; JEEBench: 80% против 68,3%; SVAMP: 92% против 84%), демонстрируют возможности HASHIRU. Кейс-стадии иллюстрируют его самоулучшение через автономную генерацию моделей затрат, интеграцию инструментов и управление бюджетом. HASHIRU предлагает перспективный подход для создания более устойчивых, эффективных и адаптивных MAS благодаря динамическому иерархическому управлению, гибридному интеллекту с учетом ресурсов и автономному функциональному расширению. Исходный код и бенчмарки доступны по адресам https://github.com/HASHIRU-AI/HASHIRU и https://github.com/HASHIRU-AI/HASHIRUBench соответственно, а живая демонстрация доступна по запросу на https://hashiruagentx-hashiruai.hf.space.

English

Rapid Large Language Model (LLM) advancements are fueling autonomous Multi-Agent System (MAS) development. However, current frameworks often lack flexibility, resource awareness, model diversity, and autonomous tool creation. This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), a novel MAS framework enhancing flexibility, resource efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically managing specialized "employee" agents, instantiated based on task needs and resource constraints (cost, memory). Its hybrid intelligence prioritizes smaller, local LLMs (via Ollama) while flexibly using external APIs and larger models when necessary. An economic model with hiring/firing costs promotes team stability and efficient resource allocation. The system also includes autonomous API tool creation and a memory function. Evaluations on tasks like academic paper review (58% success), safety assessments (100% on a JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate HASHIRU's capabilities. Case studies illustrate its self-improvement via autonomous cost model generation, tool integration, and budget management. HASHIRU offers a promising approach for more robust, efficient, and adaptable MAS through dynamic hierarchical control, resource-aware hybrid intelligence, and autonomous functional extension. Source code and benchmarks are available at https://github.com/HASHIRU-AI/HASHIRU and https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is available at https://hashiruagentx-hashiruai.hf.space upon request.

HASHIRU: Иерархическая агентная система для гибридного интеллектуального использования ресурсов

HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Аннотация

Support