Raciocínio Recursivo Generativo
Generative Recursive Reasoning
May 20, 2026
Autores: Junyeob Baek, Mingyu Jo, Minsu Kim, Mengye Ren, Yoshua Bengio, Sungjin Ahn
cs.AI
Resumo
Como futuros sistemas de raciocínio neural devem implementar computação estendida? Os Modelos de Raciocínio Recursivo (RRMs) oferecem uma alternativa promissora à extensão sequencial autorregressiva ao realizar refinamento iterativo de estados latentes com funções de transição compartilhadas. No entanto, os RRMs existentes são amplamente determinísticos, seguindo uma única trajetória latente e convergindo para uma única previsão. Apresentamos os Modelos de Raciocínio Recursivo Generativo (GRAM), uma estrutura que transforma o raciocínio recursivo latente em computação probabilística de múltiplas trajetórias. O GRAM modela o raciocínio como uma trajetória latente estocástica, permitindo múltiplas hipóteses, estratégias alternativas de solução e escalonamento em tempo de inferência tanto pela profundidade recursiva quanto pela amostragem paralela de trajetórias. Isso resulta em um modelo generativo de variáveis latentes que suporta raciocínio condicional via \(p_\theta(y \mid x)\) e, com entradas fixas ou ausentes, geração incondicional via \(p_\theta(x)\). Treinado com inferência variacional amortizada, o GRAM supera as bases recorrentes e recursivas determinísticas em tarefas de raciocínio estruturado e satisfação de restrições com múltiplas soluções, ao mesmo tempo que demonstra capacidade de geração incondicional. https://ahn-ml.github.io/gram-website
English
How should future neural reasoning systems implement extended computation? Recursive Reasoning Models (RRMs) offer a promising alternative to autoregressive sequence extension by performing iterative latent-state refinement with shared transition functions. Yet existing RRMs are largely deterministic, following a single latent trajectory and converging to a single prediction. We introduce Generative Recursive reAsoning Models (GRAM), a framework that turns recursive latent reasoning into probabilistic multi-trajectory computation. GRAM models reasoning as a stochastic latent trajectory, enabling multiple hypotheses, alternative solution strategies, and inference-time scaling through both recursive depth and parallel trajectory sampling. This yields a latent-variable generative model supporting conditional reasoning via p_θ(y mid x) and, with fixed or absent inputs, unconditional generation via p_θ(x). Trained with amortized variational inference, GRAM improves over deterministic recurrent and recursive baselines on structured reasoning and multi-solution constraint satisfaction tasks, while demonstrating an unconditional generation capability. https://ahn-ml.github.io/gram-website