Yunjue Agent技术报告：面向开放任务的完全可复现、零启动原位自进化智能体系统

Abstract

I sistemi agenti convenzionali spesso incontrano difficoltà in ambienti aperti, dove le distribuzioni dei compiti subiscono una deriva continua e la supervisione esterna è scarsa. La loro dipendenza da set di strumenti statici o da addestramento offline non riesce a tenere il passo con queste dinamiche, lasciando i confini delle capacità del sistema rigidi e sconosciuti. Per affrontare questo problema, proponiamo il paradigma di Auto-Evoluzione in Situ. Questo approccio tratta le interazioni sequenziali con i compiti come un flusso continuo di esperienza, consentendo al sistema di distillare il feedback esecutivo a breve termine in capacità riutilizzabili a lungo termine, senza accesso a etichette di verità fondamentale. All'interno di questo quadro, identifichiamo l'evoluzione degli strumenti come il percorso critico per l'espansione delle capacità, poiché fornisce segnali di feedback binari e verificabili. All'interno di questo quadro, sviluppiamo Yunjue Agent, un sistema che sintetizza, ottimizza e riutilizza iterativamente gli strumenti per affrontare le sfide emergenti. Per ottimizzare l'efficienza evolutiva, introduciamo ulteriormente una strategia di Evoluzione in Batch Parallelo. Valutazioni empiriche su cinque benchmark diversi in uno scenario di partenza zero dimostrano significativi miglioramenti delle prestazioni rispetto a baseline proprietarie. Inoltre, valutazioni complementari con partenza calda confermano che la conoscenza generale accumulata può essere trasferita senza soluzione di continuità a nuovi domini. Infine, proponiamo una nuova metrica per monitorare la convergenza evolutiva, che funge da analogo della loss di addestramento nell'ottimizzazione convenzionale. Rendiamo open-source il nostro codice base, le tracce di sistema e gli strumenti evoluti per facilitare la ricerca futura sull'intelligenza resiliente e auto-evolutiva.

English

Conventional agent systems often struggle in open-ended environments where task distributions continuously drift and external supervision is scarce. Their reliance on static toolsets or offline training lags behind these dynamics, leaving the system's capability boundaries rigid and unknown. To address this, we propose the In-Situ Self-Evolving paradigm. This approach treats sequential task interactions as a continuous stream of experience, enabling the system to distill short-term execution feedback into long-term, reusable capabilities without access to ground-truth labels. Within this framework, we identify tool evolution as the critical pathway for capability expansion, which provides verifiable, binary feedback signals. Within this framework, we develop Yunjue Agent, a system that iteratively synthesizes, optimizes, and reuses tools to navigate emerging challenges. To optimize evolutionary efficiency, we further introduce a Parallel Batch Evolution strategy. Empirical evaluations across five diverse benchmarks under a zero-start setting demonstrate significant performance gains over proprietary baselines. Additionally, complementary warm-start evaluations confirm that the accumulated general knowledge can be seamlessly transferred to novel domains. Finally, we propose a novel metric to monitor evolution convergence, serving as a function analogous to training loss in conventional optimization. We open-source our codebase, system traces, and evolved tools to facilitate future research in resilient, self-evolving intelligence.

Yunjue Agent技术报告：面向开放任务的完全可复现、零启动原位自进化智能体系统

Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks

Abstract

Support