EvoFSM: Beheersbare Zelfevolutie voor Diepgaand Onderzoek met Eindige Toestandsautomaten
EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines
January 14, 2026
Auteurs: Shuo Zhang, Chaofa Yuan, Ryan Guo, Xiaomin Yu, Rui Xu, Zhangquan Chen, Zinuo Li, Zhi Yang, Shuhao Guan, Zhenheng Tang, Sen Hu, Liwen Zhang, Ronghao Chen, Huacan Wang
cs.AI
Samenvatting
Hoewel op LLM gebaseerde agents veelbelovend zijn voor diepgaand onderzoek, vertrouwen de meeste bestaande benaderingen op vaste workflows die moeite hebben zich aan te passen aan realistische, open-einde vragen. Recent werk onderzoekt daarom zelf-evolutie door agents hun eigen code of prompts te laten herschrijven om het probleemoplossend vermogen te verbeteren, maar onbeperkte optimalisatie leidt vaak tot instabiliteit, hallucinaties en instructie-drift. Wij stellen EvoFSM voor, een gestructureerd zelf-evoluerend framework dat zowel aanpasbaarheid als controle bereikt door een expliciete Eindige Toestandsautomaat (Finite State Machine, FSM) te evolueren in plaats van te vertrouwen op vrijvormig herschrijven. EvoFSM ontkoppelt de optimalisatieruimte in macroscopische Flow (toestandsovergangslogica) en microscopische Skill (toestandspecifiek gedrag), wat gerichte verbeteringen mogelijk maakt binnen duidelijke gedragsgrenzen. Geleid door een criticus-mechanisme verfijnt EvoFSM de FSM via een kleine set beperkte operaties, en integreert het verder een zelf-evoluerend geheugen dat succesvolle trajecten destilleert tot herbruikbare priors en faalpatronen tot restricties voor toekomstige vragen. Uitgebreide evaluaties op vijf multi-hop vraag-antwoord benchmarks tonen de effectiviteit van EvoFSM aan. In het bijzonder bereikt EvoFSM een nauwkeurigheid van 58,0% op de DeepSearch benchmark. Aanvullende resultaten op interactieve besluitvormingstaken valideren verder de generalisatie ervan.
English
While LLM-based agents have shown promise for deep research, most existing approaches rely on fixed workflows that struggle to adapt to real-world, open-ended queries. Recent work therefore explores self-evolution by allowing agents to rewrite their own code or prompts to improve problem-solving ability, but unconstrained optimization often triggers instability, hallucinations, and instruction drift. We propose EvoFSM, a structured self-evolving framework that achieves both adaptability and control by evolving an explicit Finite State Machine (FSM) instead of relying on free-form rewriting. EvoFSM decouples the optimization space into macroscopic Flow (state-transition logic) and microscopic Skill (state-specific behaviors), enabling targeted improvements under clear behavioral boundaries. Guided by a critic mechanism, EvoFSM refines the FSM through a small set of constrained operations, and further incorporates a self-evolving memory that distills successful trajectories as reusable priors and failure patterns as constraints for future queries. Extensive evaluations on five multi-hop QA benchmarks demonstrate the effectiveness of EvoFSM. In particular, EvoFSM reaches 58.0% accuracy on the DeepSearch benchmark. Additional results on interactive decision-making tasks further validate its generalization.