HASHIRU: Sistema de Agentes Hierárquicos para Utilização Híbrida de Recursos Inteligentes

Resumo

Os rápidos avanços em Modelos de Linguagem de Grande Escala (LLMs) estão impulsionando o desenvolvimento de Sistemas Multiagente (MAS) autônomos. No entanto, os frameworks atuais frequentemente carecem de flexibilidade, consciência de recursos, diversidade de modelos e criação autônoma de ferramentas. Este artigo apresenta o HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), um novo framework MAS que aprimora a flexibilidade, eficiência de recursos e adaptabilidade. O HASHIRU possui um agente "CEO" que gerencia dinamicamente agentes especializados "funcionários", instanciados com base nas necessidades da tarefa e restrições de recursos (custo, memória). Sua inteligência híbrida prioriza LLMs menores e locais (via Ollama), enquanto utiliza de forma flexível APIs externas e modelos maiores quando necessário. Um modelo econômico com custos de contratação/demissão promove estabilidade da equipe e alocação eficiente de recursos. O sistema também inclui criação autônoma de ferramentas de API e uma função de memória. Avaliações em tarefas como revisão de artigos acadêmicos (58% de sucesso), avaliações de segurança (100% em um subconjunto do JailbreakBench) e raciocínio complexo (superando o Gemini 2.0 Flash no GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68,3%; SVAMP: 92% vs. 84%) demonstram as capacidades do HASHIRU. Estudos de caso ilustram sua autossuperação por meio de geração autônoma de modelos de custo, integração de ferramentas e gerenciamento de orçamento. O HASHIRU oferece uma abordagem promissora para MAS mais robustos, eficientes e adaptáveis por meio de controle hierárquico dinâmico, inteligência híbrida consciente de recursos e extensão funcional autônoma. O código-fonte e benchmarks estão disponíveis em https://github.com/HASHIRU-AI/HASHIRU e https://github.com/HASHIRU-AI/HASHIRUBench, respectivamente, e uma demonstração ao vivo está disponível em https://hashiruagentx-hashiruai.hf.space mediante solicitação.

English

Rapid Large Language Model (LLM) advancements are fueling autonomous Multi-Agent System (MAS) development. However, current frameworks often lack flexibility, resource awareness, model diversity, and autonomous tool creation. This paper introduces HASHIRU (Hierarchical Agent System for Hybrid Intelligent Resource Utilization), a novel MAS framework enhancing flexibility, resource efficiency, and adaptability. HASHIRU features a "CEO" agent dynamically managing specialized "employee" agents, instantiated based on task needs and resource constraints (cost, memory). Its hybrid intelligence prioritizes smaller, local LLMs (via Ollama) while flexibly using external APIs and larger models when necessary. An economic model with hiring/firing costs promotes team stability and efficient resource allocation. The system also includes autonomous API tool creation and a memory function. Evaluations on tasks like academic paper review (58% success), safety assessments (100% on a JailbreakBench subset), and complex reasoning (outperforming Gemini 2.0 Flash on GSM8K: 96% vs. 61%; JEEBench: 80% vs. 68.3%; SVAMP: 92% vs. 84%) demonstrate HASHIRU's capabilities. Case studies illustrate its self-improvement via autonomous cost model generation, tool integration, and budget management. HASHIRU offers a promising approach for more robust, efficient, and adaptable MAS through dynamic hierarchical control, resource-aware hybrid intelligence, and autonomous functional extension. Source code and benchmarks are available at https://github.com/HASHIRU-AI/HASHIRU and https://github.com/HASHIRU-AI/HASHIRUBench respectively, and a live demo is available at https://hashiruagentx-hashiruai.hf.space upon request.

HASHIRU: Sistema de Agentes Hierárquicos para Utilização Híbrida de Recursos Inteligentes

HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Resumo

Support