ChatPaper.aiChatPaper

ReGuLaR: 렌더링된 사고 사슬로 안내되는 변분 잠재 추론

ReGuLaR: Variational Latent Reasoning Guided by Rendered Chain-of-Thought

January 30, 2026
저자: Fanmeng Wang, Haotian Liu, Guojiang Zhao, Hongteng Xu, Zhifeng Gao
cs.AI

초록

체인 오브 쏘트(CoT)는 대규모 언어 모델(LLM)의 성능을 크게 향상시키지만, 명시적 추론 체인은 상당한 계산적 중복성을 초래합니다. 최근 등장한 잠재 추론 방법들은 추론 과정을 잠재 공간으로 압축하여 이를 완화하려 시도하지만, 적절한 압축 지침의 부족으로 인해 종종 심각한 성능 저하를 겪습니다. 본 연구에서는 이러한 문제를 해결하는 간단하면서도 새로운 잠재 학습 패러다임인 ReGuLaR(Rendered CoT-Guided variational Latent Reasoning)를 제안합니다. 근본적으로 우리는 변분 자동 인코더(VAE) 프레임워크 내에서 잠재 추론을 공식화하며, 이전 상태에 조건부인 사후 분포로부터 현재 잠재 추론 상태를 샘플링합니다. 구체적으로, 이 변분 잠재 추론 모델을 학습할 때 명시적 추론 체인을 이미지로 렌더링하고, 여기서 추출한 밀집된 시각-의미 표현으로 사후 분포를 정규화하여 정보 손실을 최소화하면서 효율적인 압축을 달성합니다. 폭넓은 실험을 통해 ReGuLaR가 계산 효율성과 추론 효과성 모두에서 기존 잠재 추론 방법들을 크게 능가하며, 다중 모달 추론을 통해 CoT를 능가하기까지 하여 잠재 추론에 대한 새롭고 통찰력 있는 해결책을 제공함을 입증했습니다. 코드: https://github.com/FanmengWang/ReGuLaR.
English
While Chain-of-Thought (CoT) significantly enhances the performance of Large Language Models (LLMs), explicit reasoning chains introduce substantial computational redundancy. Recent latent reasoning methods attempt to mitigate this by compressing reasoning processes into latent space, but often suffer from severe performance degradation due to the lack of appropriate compression guidance. In this study, we propose Rendered CoT-Guided variational Latent Reasoning (ReGuLaR), a simple yet novel latent learning paradigm resolving this issue. Fundamentally, we formulate latent reasoning within the Variational Auto-Encoding (VAE) framework, sampling the current latent reasoning state from the posterior distribution conditioned on previous ones. Specifically, when learning this variational latent reasoning model, we render explicit reasoning chains as images, from which we extract dense visual-semantic representations to regularize the posterior distribution, thereby achieving efficient compression with minimal information loss. Extensive experiments demonstrate that ReGuLaR significantly outperforms existing latent reasoning methods across both computational efficiency and reasoning effectiveness, and even surpasses CoT through multi-modal reasoning, providing a new and insightful solution to latent reasoning. Code: https://github.com/FanmengWang/ReGuLaR.
PDF212February 3, 2026