Comprendiendo el Proceso de Pensamiento de los Modelos de Razonamiento: Una Perspectiva desde la Teoría de Episodios de Schoenfeld
Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory
September 18, 2025
Autores: Ming Li, Nan Zhang, Chenrui Fan, Hong Jiao, Yanbin Fu, Sydney Peters, Qingshu Xu, Robert Lissitz, Tianyi Zhou
cs.AI
Resumen
Mientras que los Modelos de Razonamiento a Gran Escala (LRMs, por sus siglas en inglés) generan cadenas de pensamiento extensas, carecemos de un marco teórico fundamentado para comprender cómo se estructuran estos pensamientos. En este artículo, presentamos un enfoque novedoso al aplicar la Teoría de Episodios de Schoenfeld, un marco cognitivo clásico para la resolución de problemas matemáticos humanos, para analizar las trazas de razonamiento de los LRMs. Anotamos miles de oraciones y párrafos de soluciones generadas por modelos a problemas matemáticos utilizando siete etiquetas cognitivas (por ejemplo, Planificar, Implementar, Verificar). El resultado es el primer punto de referencia disponible públicamente para el análisis detallado del razonamiento automático, que incluye un corpus anotado de gran tamaño y guías de anotación detalladas. Nuestro análisis preliminar revela patrones distintivos en el razonamiento de los LRMs, como las dinámicas de transición entre estados cognitivos. Este marco proporciona una metodología teóricamente fundamentada para interpretar la cognición de los LRMs y permite trabajos futuros en sistemas de razonamiento más controlables y transparentes.
English
While Large Reasoning Models (LRMs) generate extensive chain-of-thought
reasoning, we lack a principled framework for understanding how these thoughts
are structured. In this paper, we introduce a novel approach by applying
Schoenfeld's Episode Theory, a classic cognitive framework for human
mathematical problem-solving, to analyze the reasoning traces of LRMs. We
annotated thousands of sentences and paragraphs from model-generated solutions
to math problems using seven cognitive labels (e.g., Plan, Implement, Verify).
The result is the first publicly available benchmark for the fine-grained
analysis of machine reasoning, including a large annotated corpus and detailed
annotation guidebooks. Our preliminary analysis reveals distinct patterns in
LRM reasoning, such as the transition dynamics between cognitive states. This
framework provides a theoretically grounded methodology for interpreting LRM
cognition and enables future work on more controllable and transparent
reasoning systems.