JoyAgent-JDGenie: Relatório Técnico sobre o GAIA
JoyAgent-JDGenie: Technical Report on the GAIA
October 1, 2025
Autores: Jiarun Liu, Shiyue Xu, Shangkun Liu, Yang Li, Wen Liu, Min Liu, Xiaoqing Zhou, Hanmin Wang, Shilin Jia, zhen Wang, Shaohua Tian, Hanhao Li, Junbo Zhang, Yongli Yu, Peng Cao, Haofen Wang
cs.AI
Resumo
Modelos de Linguagem de Grande Escala estão sendo cada vez mais implantados como agentes autônomos para tarefas complexas do mundo real, mas os sistemas existentes frequentemente se concentram em melhorias isoladas sem um design unificador para robustez e adaptabilidade. Propomos uma arquitetura de agente generalista que integra três componentes principais: um framework multiagente coletivo que combina agentes de planejamento e execução com votação de modelos críticos, um sistema de memória hierárquico abrangendo camadas de trabalho, semântica e procedimental, e um conjunto refinado de ferramentas para busca, execução de código e análise multimodal. Avaliado em um benchmark abrangente, nosso framework consistentemente supera as bases de código aberto e se aproxima do desempenho de sistemas proprietários. Esses resultados demonstram a importância da integração em nível de sistema e destacam um caminho para assistentes de IA escaláveis, resilientes e adaptáveis, capazes de operar em diversos domínios e tarefas.
English
Large Language Models are increasingly deployed as autonomous agents for
complex real-world tasks, yet existing systems often focus on isolated
improvements without a unifying design for robustness and adaptability. We
propose a generalist agent architecture that integrates three core components:
a collective multi-agent framework combining planning and execution agents with
critic model voting, a hierarchical memory system spanning working, semantic,
and procedural layers, and a refined tool suite for search, code execution, and
multimodal parsing. Evaluated on a comprehensive benchmark, our framework
consistently outperforms open-source baselines and approaches the performance
of proprietary systems. These results demonstrate the importance of
system-level integration and highlight a path toward scalable, resilient, and
adaptive AI assistants capable of operating across diverse domains and tasks.