Generatief recursief redeneren

Samenvatting

Hoe moeten toekomstige neurale redeneersystemen uitgebreide berekening implementeren? Recursieve Redeneermodellen (RRM's) bieden een veelbelovend alternatief voor autoregressieve sequentie-extensie door het uitvoeren van iteratieve verfijning van latente toestanden met gedeelde overgangsfuncties. Toch zijn bestaande RRM's grotendeels deterministisch, waarbij ze een enkel latent traject volgen en convergeren naar een enkele voorspelling. We introduceren Generatieve Recursieve Redeneermodellen (GRAM), een raamwerk dat recursief latent redeneren omzet in probabilistische multi-trajectberekening. GRAM modelleert redeneren als een stochastisch latent traject, waardoor meerdere hypothesen, alternatieve oplossingsstrategieën en schaling tijdens inferentie mogelijk worden door zowel recursieve diepte als parallelle trajectbemonstering. Dit levert een latent-variabel generatief model op dat conditioneel redeneren ondersteunt via \(p_\theta(y \mid x)\) en, met vaste of afwezige invoer, onvoorwaardelijke generatie via \(p_\theta(x)\). Getraind met geamortiseerde variationele inferentie presteert GRAM beter dan deterministische recurrente en recursieve baselines op gestructureerde redeneer- en multi-oplossing beperkingsvervullingstaken, terwijl het een onvoorwaardelijke generatiecapaciteit demonstreert. https://ahn-ml.github.io/gram-website

English

How should future neural reasoning systems implement extended computation? Recursive Reasoning Models (RRMs) offer a promising alternative to autoregressive sequence extension by performing iterative latent-state refinement with shared transition functions. Yet existing RRMs are largely deterministic, following a single latent trajectory and converging to a single prediction. We introduce Generative Recursive reAsoning Models (GRAM), a framework that turns recursive latent reasoning into probabilistic multi-trajectory computation. GRAM models reasoning as a stochastic latent trajectory, enabling multiple hypotheses, alternative solution strategies, and inference-time scaling through both recursive depth and parallel trajectory sampling. This yields a latent-variable generative model supporting conditional reasoning via p_θ(y mid x) and, with fixed or absent inputs, unconditional generation via p_θ(x). Trained with amortized variational inference, GRAM improves over deterministic recurrent and recursive baselines on structured reasoning and multi-solution constraint satisfaction tasks, while demonstrating an unconditional generation capability. https://ahn-ml.github.io/gram-website