EvoFSM: Autoevolución Controlada para la Investigación Profunda con Máquinas de Estado Finito
EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines
January 14, 2026
Autores: Shuo Zhang, Chaofa Yuan, Ryan Guo, Xiaomin Yu, Rui Xu, Zhangquan Chen, Zinuo Li, Zhi Yang, Shuhao Guan, Zhenheng Tang, Sen Hu, Liwen Zhang, Ronghao Chen, Huacan Wang
cs.AI
Resumen
Si bien los agentes basados en LLM han mostrado potencial para la investigación profunda, la mayoría de los enfoques existentes dependen de flujos de trabajo fijos que tienen dificultades para adaptarse a consultas abiertas del mundo real. Por ello, trabajos recientes exploran la auto-evolución permitiendo a los agentes reescribir su propio código o *prompts* para mejorar su capacidad de resolución de problemas; sin embargo, la optimización sin restricciones a menudo desencadena inestabilidad, alucinaciones y deriva de instrucciones. Proponemos EvoFSM, un marco de auto-evolución estructurado que logra tanto adaptabilidad como control mediante la evolución de una Máquina de Estados Finitos (FSM) explícita, en lugar de depender de reescrituras de forma libre. EvoFSM desacopla el espacio de optimización en *Flujo* macroscópico (lógica de transición de estados) y *Habilidad* microscópica (comportamientos específicos de estado), permitiendo mejoras dirigidas dentro de límites conductuales claros. Guiado por un mecanismo crítico, EvoFSM refina la FSM a través de un pequeño conjunto de operaciones restringidas, e incorpora además una memoria auto-evolutiva que destila trayectorias exitosas como *priors* reutilizables y patrones de fallo como restricciones para consultas futuras. Evaluaciones exhaustivas en cinco benchmarks de preguntas y respuestas de múltiples saltos demuestran la efectividad de EvoFSM. En particular, EvoFSM alcanza un 58.0% de precisión en el benchmark DeepSearch. Resultados adicionales en tareas de toma de decisiones interactivas validan aún más su generalización.
English
While LLM-based agents have shown promise for deep research, most existing approaches rely on fixed workflows that struggle to adapt to real-world, open-ended queries. Recent work therefore explores self-evolution by allowing agents to rewrite their own code or prompts to improve problem-solving ability, but unconstrained optimization often triggers instability, hallucinations, and instruction drift. We propose EvoFSM, a structured self-evolving framework that achieves both adaptability and control by evolving an explicit Finite State Machine (FSM) instead of relying on free-form rewriting. EvoFSM decouples the optimization space into macroscopic Flow (state-transition logic) and microscopic Skill (state-specific behaviors), enabling targeted improvements under clear behavioral boundaries. Guided by a critic mechanism, EvoFSM refines the FSM through a small set of constrained operations, and further incorporates a self-evolving memory that distills successful trajectories as reusable priors and failure patterns as constraints for future queries. Extensive evaluations on five multi-hop QA benchmarks demonstrate the effectiveness of EvoFSM. In particular, EvoFSM reaches 58.0% accuracy on the DeepSearch benchmark. Additional results on interactive decision-making tasks further validate its generalization.