HASHIRU: Sistema de Agentes Hierárquicos para Utilização Híbrida de Recursos Inteligentes
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
June 1, 2025
Autores: Kunal Pai, Parth Shah, Harshil Patel
cs.AI
Resumo
Os rápidos avanços em Modelos de Linguagem de Grande Escala (LLMs) estão impulsionando o desenvolvimento de Sistemas Multiagente (MAS) autônomos. No entanto, os frameworks atuais frequentemente carecem de flexibilidade, consciência de recursos, diversidade de modelos e criação autônoma de ferramentas. Este artigo apresenta o HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), um novo framework MAS que aprimora a flexibilidade, eficiência de recursos e adaptabilidade. O HASHIRU possui um agente "CEO" que gerencia dinamicamente agentes especializados "funcionários", instanciados com base nas necessidades da tarefa e restrições de recursos (custo, memória). Sua inteligência híbrida prioriza LLMs menores e locais (via Ollama), enquanto utiliza de forma flexível APIs externas e modelos maiores quando necessário. Um modelo econômico com custos de contratação/demissão promove estabilidade da equipe e alocação eficiente de recursos. O sistema também inclui criação autônoma de ferramentas de API e uma função de memória. Avaliações em tarefas como revisão de artigos acadêmicos (58% de sucesso), avaliações de segurança (100% em um subconjunto do JailbreakBench) e raciocínio complexo (superando o Gemini 2.0 Flash no GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68,3%; SVAMP: 92% vs. 84%) demonstram as capacidades do HASHIRU. Estudos de caso ilustram sua autossuperação por meio de geração autônoma de modelos de custo, integração de ferramentas e gerenciamento de orçamento. O HASHIRU oferece uma abordagem promissora para MAS mais robustos, eficientes e adaptáveis por meio de controle hierárquico dinâmico, inteligência híbrida consciente de recursos e extensão funcional autônoma. O código-fonte e benchmarks estão disponíveis em https://github.com/HASHIRU-AI/HASHIRU e https://github.com/HASHIRU-AI/HASHIRUBench, respectivamente, e uma demonstração ao vivo está disponível em https://hashiruagentx-hashiruai.hf.space mediante solicitação.
English
Rapid Large Language Model (LLM) advancements are fueling autonomous
Multi-Agent System (MAS) development. However, current frameworks often lack
flexibility, resource awareness, model diversity, and autonomous tool creation.
This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent
Resource Utilization), a novel MAS framework enhancing flexibility, resource
efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically
managing specialized "employee" agents, instantiated based on task needs and
resource constraints (cost, memory). Its hybrid intelligence prioritizes
smaller, local LLMs (via Ollama) while flexibly using external APIs and larger
models when necessary. An economic model with hiring/firing costs promotes team
stability and efficient resource allocation. The system also includes
autonomous API tool creation and a memory function. Evaluations on tasks like
academic paper review (58% success), safety assessments (100% on a
JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash
on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate
HASHIRU's capabilities. Case studies illustrate its self-improvement via
autonomous cost model generation, tool integration, and budget management.
HASHIRU offers a promising approach for more robust, efficient, and adaptable
MAS through dynamic hierarchical control, resource-aware hybrid intelligence,
and autonomous functional extension. Source code and benchmarks are available
at https://github.com/HASHIRU-AI/HASHIRU and
https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is
available at https://hashiruagentx-hashiruai.hf.space upon request.