Informe Técnico del Agente Yunjue: Un Sistema de Agentes de Auto-Evolución In Situ Completamente Reproducible y de Inicio Cero para Tareas de Final Abierto
Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks
January 26, 2026
Autores: Haotian Li, Shijun Yang, Weizhen Qi, Silei Zhao, Rui Hua, Mingzhu Song, Xiaojian Yang, Chao Peng
cs.AI
Resumen
Los sistemas de agentes convencionales a menudo enfrentan dificultades en entornos abiertos donde las distribuciones de tareas cambian continuamente y la supervisión externa es escasa. Su dependencia de conjuntos de herramientas estáticos o de entrenamiento fuera de línea no logra seguir estas dinámicas, dejando los límites de capacidad del sistema rígidos y desconocidos. Para abordar esto, proponemos el paradigma de Autoevolución In Situ. Este enfoque trata las interacciones secuenciales de tareas como un flujo continuo de experiencia, permitiendo que el sistema destile la retroalimentación de ejecución a corto plazo en capacidades reutilizables a largo plazo, sin acceso a etiquetas de verdad fundamental. Dentro de este marco, identificamos la evolución de herramientas como la vía crítica para la expansión de capacidades, la cual proporciona señales de retroalimentación binarias y verificables. En este marco, desarrollamos Yunjue Agent, un sistema que sintetiza, optimiza y reutiliza herramientas de manera iterativa para abordar desafíos emergentes. Para optimizar la eficiencia evolutiva, introducimos además una estrategia de Evolución por Lotes Paralelos. Las evaluaciones empíricas en cinco benchmarks diversos bajo una configuración de inicio desde cero demuestran ganancias significativas de rendimiento frente a líneas base propietarias. Adicionalmente, evaluaciones complementarias de inicio cálido confirman que el conocimiento general acumulado puede transferirse sin problemas a nuevos dominios. Finalmente, proponemos una nueva métrica para monitorear la convergencia evolutiva, que funciona como un análogo a la pérdida de entrenamiento en la optimización convencional. Liberamos nuestro código base, trazas del sistema y herramientas evolucionadas para facilitar futuras investigaciones en inteligencia resiliente y autoevolutiva.
English
Conventional agent systems often struggle in open-ended environments where task distributions continuously drift and external supervision is scarce. Their reliance on static toolsets or offline training lags behind these dynamics, leaving the system's capability boundaries rigid and unknown. To address this, we propose the In-Situ Self-Evolving paradigm. This approach treats sequential task interactions as a continuous stream of experience, enabling the system to distill short-term execution feedback into long-term, reusable capabilities without access to ground-truth labels. Within this framework, we identify tool evolution as the critical pathway for capability expansion, which provides verifiable, binary feedback signals. Within this framework, we develop Yunjue Agent, a system that iteratively synthesizes, optimizes, and reuses tools to navigate emerging challenges. To optimize evolutionary efficiency, we further introduce a Parallel Batch Evolution strategy. Empirical evaluations across five diverse benchmarks under a zero-start setting demonstrate significant performance gains over proprietary baselines. Additionally, complementary warm-start evaluations confirm that the accumulated general knowledge can be seamlessly transferred to novel domains. Finally, we propose a novel metric to monitor evolution convergence, serving as a function analogous to training loss in conventional optimization. We open-source our codebase, system traces, and evolved tools to facilitate future research in resilient, self-evolving intelligence.