EvoFSM: Управляемая самоэволюция для глубоких исследований с конечными автоматами
EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines
January 14, 2026
Авторы: Shuo Zhang, Chaofa Yuan, Ryan Guo, Xiaomin Yu, Rui Xu, Zhangquan Chen, Zinuo Li, Zhi Yang, Shuhao Guan, Zhenheng Tang, Sen Hu, Liwen Zhang, Ronghao Chen, Huacan Wang
cs.AI
Аннотация
Хотя агенты на основе больших языковых моделей (LLM) демонстрируют потенциал для глубоких исследований, большинство существующих подходов полагаются на фиксированные рабочие процессы, которые плохо адаптируются к реальным открытым запросам. Поэтому в последних работах исследуется саморазвитие, позволяющее агентам переписывать собственный код или промпты для повышения способности решать задачи, однако неограниченная оптимизация часто приводит к нестабильности, галлюцинациям и дрейфу инструкций. Мы предлагаем EvoFSM — структурированную саморазвивающуюся framework, которая обеспечивает как адаптивность, так и контроль за счёт эволюции явного конечного автомата (Finite State Machine, FSM) вместо свободного переписывания. EvoFSM разделяет пространство оптимизации на макроскопический Поток (логику переходов между состояниями) и микроскопические Навыки (поведения, специфичные для состояний), что позволяет осуществлять целевые улучшения в рамках чётких поведенческих границ. Под руководством механизма-критика EvoFSM совершенствует FSM с помощью небольшого набора ограниченных операций и дополнительно включает саморазвивающуюся память, которая аккумулирует успешные траектории как переиспользуемые априорные знания, а паттерны неудач — как ограничения для будущих запросов. Обширные оценки на пяти бенчмарках многошагового вопросно-ответного поиска демонстрируют эффективность EvoFSM. В частности, EvoFSM достигает точности 58,0% на бенчмарке DeepSearch. Дополнительные результаты по задачам интерактивного принятия решений further подтверждают его способность к обобщению.
English
While LLM-based agents have shown promise for deep research, most existing approaches rely on fixed workflows that struggle to adapt to real-world, open-ended queries. Recent work therefore explores self-evolution by allowing agents to rewrite their own code or prompts to improve problem-solving ability, but unconstrained optimization often triggers instability, hallucinations, and instruction drift. We propose EvoFSM, a structured self-evolving framework that achieves both adaptability and control by evolving an explicit Finite State Machine (FSM) instead of relying on free-form rewriting. EvoFSM decouples the optimization space into macroscopic Flow (state-transition logic) and microscopic Skill (state-specific behaviors), enabling targeted improvements under clear behavioral boundaries. Guided by a critic mechanism, EvoFSM refines the FSM through a small set of constrained operations, and further incorporates a self-evolving memory that distills successful trajectories as reusable priors and failure patterns as constraints for future queries. Extensive evaluations on five multi-hop QA benchmarks demonstrate the effectiveness of EvoFSM. In particular, EvoFSM reaches 58.0% accuracy on the DeepSearch benchmark. Additional results on interactive decision-making tasks further validate its generalization.