Yunjue Agent技术报告：面向开放任务的完全可复现、零启动原位自进化智能体系统

Resumo

Os sistemas de agentes convencionais frequentemente enfrentam dificuldades em ambientes abertos, onde as distribuições de tarefas mudam continuamente e a supervisão externa é escassa. Sua dependência de conjuntos de ferramentas estáticos ou treinamento offline fica aquém dessas dinâmicas, deixando os limites de capacidade do sistema rígidos e desconhecidos. Para resolver isso, propomos o paradigma de Autoevolução In Situ. Esta abordagem trata as interações sequenciais de tarefas como um fluxo contínuo de experiência, permitindo que o sistema destile o feedback de execução de curto prazo em capacidades reutilizáveis de longo prazo, sem acesso a rótulos de verdade fundamental. Dentro deste quadro, identificamos a evolução de ferramentas como o caminho crítico para a expansão de capacidades, que fornece sinais de feedback binários e verificáveis. Neste contexto, desenvolvemos o Agente Yunjue, um sistema que sintetiza, otimiza e reutiliza ferramentas iterativamente para enfrentar desafios emergentes. Para otimizar a eficiência evolutiva, introduzimos ainda uma estratégia de Evolução em Lote Paralelo. Avaliações empíricas em cinco benchmarks diversos, sob uma configuração de início zero, demonstram ganhos significativos de desempenho em comparação com baselines proprietárias. Adicionalmente, avaliações complementares de início aquecido confirmam que o conhecimento geral acumulado pode ser transferido perfeitamente para novos domínios. Por fim, propomos uma nova métrica para monitorar a convergência da evolução, funcionando como um análogo à perda de treinamento na otimização convencional. Disponibilizamos publicamente nosso código-base, traços do sistema e ferramentas evoluídas para facilitar pesquisas futuras em inteligência resiliente e autoevolutiva.

English

Conventional agent systems often struggle in open-ended environments where task distributions continuously drift and external supervision is scarce. Their reliance on static toolsets or offline training lags behind these dynamics, leaving the system's capability boundaries rigid and unknown. To address this, we propose the In-Situ Self-Evolving paradigm. This approach treats sequential task interactions as a continuous stream of experience, enabling the system to distill short-term execution feedback into long-term, reusable capabilities without access to ground-truth labels. Within this framework, we identify tool evolution as the critical pathway for capability expansion, which provides verifiable, binary feedback signals. Within this framework, we develop Yunjue Agent, a system that iteratively synthesizes, optimizes, and reuses tools to navigate emerging challenges. To optimize evolutionary efficiency, we further introduce a Parallel Batch Evolution strategy. Empirical evaluations across five diverse benchmarks under a zero-start setting demonstrate significant performance gains over proprietary baselines. Additionally, complementary warm-start evaluations confirm that the accumulated general knowledge can be seamlessly transferred to novel domains. Finally, we propose a novel metric to monitor evolution convergence, serving as a function analogous to training loss in conventional optimization. We open-source our codebase, system traces, and evolved tools to facilitate future research in resilient, self-evolving intelligence.