Технический отчет Yunjue Agent: Полностью воспроизводимая система агентов с нулевым стартом для саморазвития в реальной среде при выполнении открытых задач
Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks
January 26, 2026
Авторы: Haotian Li, Shijun Yang, Weizhen Qi, Silei Zhao, Rui Hua, Mingzhu Song, Xiaojian Yang, Chao Peng
cs.AI
Аннотация
Традиционные агентные системы часто оказываются неэффективными в открытых средах, где распределение задач непрерывно меняется, а внешний контроль ограничен. Их зависимость от статичных наборов инструментов или офлайн-обучения не успевает за этими динамическими изменениями, оставляя границы возможностей системы жесткими и неизвестными. Для решения этой проблемы мы предлагаем парадигму In-Situ Self-Evolving (эволюционирующей на месте). Этот подход рассматривает последовательные взаимодействия с задачами как непрерывный поток опыта, позволяя системе преобразовывать краткосрочную обратную связь по выполнению в долгосрочные, многократно используемые возможности без доступа к эталонным меткам. В рамках данной парадигмы мы определяем эволюцию инструментов как ключевой путь для расширения возможностей, поскольку она предоставляет проверяемые бинарные сигналы обратной связи. В рамках этого подхода мы разработали агент Yunjue — систему, которая итеративно синтезирует, оптимизирует и повторно использует инструменты для решения вновь возникающих задач. Для оптимизации эффективности эволюции мы дополнительно вводим стратегию Parallel Batch Evolution (параллельного пакетного развития). Эмпирические оценки на пяти разнородных бенчмарках в условиях нулевого старта демонстрируют значительное улучшение производительности по сравнению с проприетарными базовыми системами. Кроме того, дополнительные оценки с теплым стартом подтверждают, что накопленные общие знания могут быть бесшовно перенесены в новые области. Наконец, мы предлагаем новую метрику для мониторинга сходимости эволюции, которая служит аналогом функции потерь при обучении в традиционной оптимизации. Мы открываем исходный код нашей системы, трассировки её работы и evolved-инструменты для содействия будущим исследованиям в области устойчивого, саморазвивающегося интеллекта.
English
Conventional agent systems often struggle in open-ended environments where task distributions continuously drift and external supervision is scarce. Their reliance on static toolsets or offline training lags behind these dynamics, leaving the system's capability boundaries rigid and unknown. To address this, we propose the In-Situ Self-Evolving paradigm. This approach treats sequential task interactions as a continuous stream of experience, enabling the system to distill short-term execution feedback into long-term, reusable capabilities without access to ground-truth labels. Within this framework, we identify tool evolution as the critical pathway for capability expansion, which provides verifiable, binary feedback signals. Within this framework, we develop Yunjue Agent, a system that iteratively synthesizes, optimizes, and reuses tools to navigate emerging challenges. To optimize evolutionary efficiency, we further introduce a Parallel Batch Evolution strategy. Empirical evaluations across five diverse benchmarks under a zero-start setting demonstrate significant performance gains over proprietary baselines. Additionally, complementary warm-start evaluations confirm that the accumulated general knowledge can be seamlessly transferred to novel domains. Finally, we propose a novel metric to monitor evolution convergence, serving as a function analogous to training loss in conventional optimization. We open-source our codebase, system traces, and evolved tools to facilitate future research in resilient, self-evolving intelligence.