ChatPaper.aiChatPaper

EvoFSM : Auto-évolution contrôlée pour la recherche approfondie à l'aide de machines à états finis

EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines

January 14, 2026
papers.authors: Shuo Zhang, Chaofa Yuan, Ryan Guo, Xiaomin Yu, Rui Xu, Zhangquan Chen, Zinuo Li, Zhi Yang, Shuhao Guan, Zhenheng Tang, Sen Hu, Liwen Zhang, Ronghao Chen, Huacan Wang
cs.AI

papers.abstract

Si les agents basés sur LLM ont montré des résultats prometteurs pour la recherche approfondie, la plupart des approches existantes reposent sur des flux de travail fixes qui peinent à s'adapter aux requêtes ouvertes du monde réel. Des travaux récents explorent donc l'auto-évolution en permettant aux agents de réécrire leur propre code ou prompts pour améliorer leur capacité de résolution de problèmes, mais une optimisation non contrainte déclenche souvent de l'instabilité, des hallucinations et une dérive des instructions. Nous proposons EvoFSM, un framework d'auto-évolution structuré qui concilie adaptabilité et contrôle en faisant évoluer une Machine à États Finis (MEF) explicite plutôt que de s'appuyer sur une réécriture libre. EvoFSM découple l'espace d'optimisation en un Flux macroscopique (logique de transition d'état) et des Compétences microscopiques (comportements spécifiques à un état), permettant des améliorations ciblées dans des limites comportementales claires. Guidé par un mécanisme de critique, EvoFSM affine la MEF via un petit ensemble d'opérations contraintes, et intègre en outre une mémoire auto-évolutive qui distille les trajectoires réussies en connaissances a priori réutilisables et les patterns d'échec en contraintes pour les requêtes futures. Des évaluations approfondies sur cinq benchmarks de QA multi-étapes démontrent l'efficacité d'EvoFSM. En particulier, EvoFSM atteint une précision de 58,0 % sur le benchmark DeepSearch. Des résultats supplémentaires sur des tâches de prise de décision interactive valident davantage sa généralisation.
English
While LLM-based agents have shown promise for deep research, most existing approaches rely on fixed workflows that struggle to adapt to real-world, open-ended queries. Recent work therefore explores self-evolution by allowing agents to rewrite their own code or prompts to improve problem-solving ability, but unconstrained optimization often triggers instability, hallucinations, and instruction drift. We propose EvoFSM, a structured self-evolving framework that achieves both adaptability and control by evolving an explicit Finite State Machine (FSM) instead of relying on free-form rewriting. EvoFSM decouples the optimization space into macroscopic Flow (state-transition logic) and microscopic Skill (state-specific behaviors), enabling targeted improvements under clear behavioral boundaries. Guided by a critic mechanism, EvoFSM refines the FSM through a small set of constrained operations, and further incorporates a self-evolving memory that distills successful trajectories as reusable priors and failure patterns as constraints for future queries. Extensive evaluations on five multi-hop QA benchmarks demonstrate the effectiveness of EvoFSM. In particular, EvoFSM reaches 58.0% accuracy on the DeepSearch benchmark. Additional results on interactive decision-making tasks further validate its generalization.
PDF111January 16, 2026