ChatPaper.aiChatPaper

LatentChem: 텍스트 CoT에서 화학 추론의 잠재적 사고로

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

February 6, 2026
저자: Xinwu Ye, Yicheng Mao, Jia Zhang, Yimeng Liu, Li Hao, Fang Wu, Zhiwei Li, Yuxuan Liao, Zehong Wang, Zhiyuan Liu, Zhenfei Yin, Li Yuan, Philip Torr, Huan Sun, Xiangxiang Zeng, Mengdi Wang, Le Cong, Shenghua Gao, Xiangru Tang
cs.AI

초록

화학 분야 대규모 언어 모델(LLM)은 복잡한 추론을 수행하기 위해 주로 자연어 형태의 명시적 사고의 연쇄(CoT)에 의존합니다. 그러나 화학 추론은 본질적으로 연속적이고 구조적인 특성을 지니며, 이를 이산적인 언어 토큰으로 강제 변환하는 것은 효율성과 성능을 제한하는 근본적인 표현 불일치를 초래합니다. 우리는 LatentChem을 소개합니다. 이는 화학 계산을 텍스트 생성에서 분리하는 잠재 추론 인터페이스로, 모델이 최종 출력에만 언어를 사용하면서 다단계 추론을 연속 잠재 공간에서 직접 수행할 수 있게 합니다. 주목할 만하게도, 우리는 과제 성공만을 위해 최적화되었을 때 모델이 자발적으로 추론을 내재화하여 장황한 텍스트 유도를 점차 포기하고 암묵적인 잠재 계산을 선호하는 일관된 창발적 행동을 관찰했습니다. 이러한 변화는 단순히 스타일의 문제가 아닌 계산적 이점을 제공합니다. 다양한 화학 추론 벤치마크에서 LatentChem은 ChemCoTBench에서 강력한 CoT 기반 베이스라인 대비 59.88%의 무승부 제외 우승률을 달성했으며, 평균 10.84배의 추론 속도 향상을 제공했습니다. 우리의 결과는 화학 추론이 이산화된 언어 궤적보다 연속적인 잠재 역학으로 구현될 때 더 자연스럽고 효과적으로 실현된다는 경험적 증거를 제시합니다.
English
Chemical large language models (LLMs) predominantly rely on explicit Chain-of-Thought (CoT) in natural language to perform complex reasoning. However, chemical reasoning is inherently continuous and structural, and forcing it into discrete linguistic tokens introduces a fundamental representation mismatch that constrains both efficiency and performance. We introduce LatentChem, a latent reasoning interface that decouples chemical computation from textual generation, enabling models to perform multi-step reasoning directly in continuous latent space while emitting language only for final outputs. Remarkably, we observe a consistent emergent behavior: when optimized solely for task success, models spontaneously internalize reasoning, progressively abandoning verbose textual derivations in favor of implicit latent computation. This shift is not merely stylistic but computationally advantageous. Across diverse chemical reasoning benchmarks, LatentChem achieves a 59.88\% non-tie win rate over strong CoT-based baselines on ChemCoTBench, while delivering a 10.84times average inference speedup. Our results provide empirical evidence that chemical reasoning is more naturally and effectively realized as continuous latent dynamics rather than discretized linguistic trajectories.
PDF172February 11, 2026