Razonamiento Recursivo Generativo
Generative Recursive Reasoning
May 20, 2026
Autores: Junyeob Baek, Mingyu Jo, Minsu Kim, Mengye Ren, Yoshua Bengio, Sungjin Ahn
cs.AI
Resumen
¿Cómo deberían los futuros sistemas de razonamiento neuronal implementar cómputo extendido? Los Modelos de Razonamiento Recursivo (RRMs) ofrecen una alternativa prometedora a la extensión de secuencia autorregresiva al realizar un refinamiento iterativo de estados latentes con funciones de transición compartidas. No obstante, los RRMs existentes son en gran medida deterministas: siguen una única trayectoria latente y convergen a una sola predicción. Presentamos los Modelos Generativos de Razonamiento Recursivo (GRAM), un marco que transforma el razonamiento recursivo latente en cómputo probabilístico multi-trayectoria. GRAM modela el razonamiento como una trayectoria latente estocástica, lo que permite múltiples hipótesis, estrategias de solución alternativas y escalado en tiempo de inferencia tanto mediante profundidad recursiva como mediante muestreo paralelo de trayectorias. Esto da lugar a un modelo generativo de variables latentes que admite razonamiento condicional mediante p_θ(y | x) y, con entradas fijas o ausentes, generación incondicional mediante p_θ(x). Entrenado con inferencia variacional amortiguada, GRAM supera a las líneas base deterministas recurrentes y recursivas en tareas de razonamiento estructurado y satisfacción de restricciones multi-solución, al tiempo que demuestra capacidad de generación incondicional. https://ahn-ml.github.io/gram-website
English
How should future neural reasoning systems implement extended computation? Recursive Reasoning Models (RRMs) offer a promising alternative to autoregressive sequence extension by performing iterative latent-state refinement with shared transition functions. Yet existing RRMs are largely deterministic, following a single latent trajectory and converging to a single prediction. We introduce Generative Recursive reAsoning Models (GRAM), a framework that turns recursive latent reasoning into probabilistic multi-trajectory computation. GRAM models reasoning as a stochastic latent trajectory, enabling multiple hypotheses, alternative solution strategies, and inference-time scaling through both recursive depth and parallel trajectory sampling. This yields a latent-variable generative model supporting conditional reasoning via p_θ(y mid x) and, with fixed or absent inputs, unconditional generation via p_θ(x). Trained with amortized variational inference, GRAM improves over deterministic recurrent and recursive baselines on structured reasoning and multi-solution constraint satisfaction tasks, while demonstrating an unconditional generation capability. https://ahn-ml.github.io/gram-website