Rapport Technique de l'Agent Yunjue : Un Système Agentique Auto-Évolutif In Situ, Entièrement Reproductible et à Démarrage Zéro pour les Tâches Ouvertes

papers.abstract

Les systèmes d'agents conventionnels peinent souvent dans des environnements ouverts où la distribution des tâches dérive continuellement et où la supervision externe est rare. Leur dépendance à des ensembles d'outils statiques ou à un apprentissage hors ligne ne suit pas ces dynamiques, laissant les limites de capacité du système rigides et inconnues. Pour résoudre ce problème, nous proposons le paradigme de l'auto-évolution in situ. Cette approche traite les interactions séquentielles de tâches comme un flux continu d'expérience, permettant au système de distiller les retours d'exécution à court terme en capacités réutilisables à long terme, sans accès à des étiquettes de vérité terrain. Dans ce cadre, nous identifions l'évolution des outils comme la voie critique pour l'expansion des capacités, laquelle fournit des signaux de retour binaires et vérifiables. Au sein de ce cadre, nous développons Yunjue Agent, un système qui synthétise, optimise et réutilise itérativement des outils pour relever les défis émergents. Pour optimiser l'efficacité évolutive, nous introduisons en outre une stratégie d'Évolution par Lots Parallèles. Des évaluations empiriques sur cinq benchmarks diversifiés, dans un contexte de démarrage à froid, démontrent des gains de performance significatifs par rapport à des modèles de référence propriétaires. De plus, des évaluations complémentaires en démarrage à chaud confirment que les connaissances générales accumulées peuvent être transférées de manière transparente à de nouveaux domaines. Enfin, nous proposons une nouvelle métrique pour surveiller la convergence de l'évolution, servant de fonction analogue à la perte d'entraînement dans l'optimisation conventionnelle. Nous ouvrons le code source, les traces système et les outils évolués pour faciliter les recherches futures sur une intelligence résiliente et auto-évolutive.

English

Conventional agent systems often struggle in open-ended environments where task distributions continuously drift and external supervision is scarce. Their reliance on static toolsets or offline training lags behind these dynamics, leaving the system's capability boundaries rigid and unknown. To address this, we propose the In-Situ Self-Evolving paradigm. This approach treats sequential task interactions as a continuous stream of experience, enabling the system to distill short-term execution feedback into long-term, reusable capabilities without access to ground-truth labels. Within this framework, we identify tool evolution as the critical pathway for capability expansion, which provides verifiable, binary feedback signals. Within this framework, we develop Yunjue Agent, a system that iteratively synthesizes, optimizes, and reuses tools to navigate emerging challenges. To optimize evolutionary efficiency, we further introduce a Parallel Batch Evolution strategy. Empirical evaluations across five diverse benchmarks under a zero-start setting demonstrate significant performance gains over proprietary baselines. Additionally, complementary warm-start evaluations confirm that the accumulated general knowledge can be seamlessly transferred to novel domains. Finally, we propose a novel metric to monitor evolution convergence, serving as a function analogous to training loss in conventional optimization. We open-source our codebase, system traces, and evolved tools to facilitate future research in resilient, self-evolving intelligence.

Rapport Technique de l'Agent Yunjue : Un Système Agentique Auto-Évolutif In Situ, Entièrement Reproductible et à Démarrage Zéro pour les Tâches Ouvertes

Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks

papers.abstract

Support