推論が法則に出会うとき
When Reasoning Meets Its Laws
December 19, 2025
著者: Junyu Zhang, Yifan Sun, Tianang Leng, Jingyan Shen, Liu Ziyin, Paul Pu Liang, Huan Zhang
cs.AI
要旨
大規模推論モデル(LRM)は優れた性能を示す一方で、その推論挙動は直感に反する場合が多く、結果として最適な推論能力が発揮されないことがある。本論文では、理想的な推論挙動を理論的に形式化するため、LRMに内在する推論パターンを特徴づける統一フレームワーク「推論の法則(Laws of Reasoning: LoRe)」を提案する。まず、推論に要する計算量が問題の複雑度に比例して増加すべきという仮説に基づき「計算量の法則」を提唱する。さらに計算量に加えて、補足的な「精度の法則」をLoReに拡張する。問題の複雑度の実践的な定量化が困難であるため、我々はこれらの仮説を、法則が持つ「単調性」と「構成性」という二つの特性に着目して検証する。そこで、大規模推論モデルのこれら二つの扱いやすい特性を体系的に測定するベンチマーク「LoRe-Bench」を導入する。評価の結果、ほとんどの推論モデルは適切な単調性を示すものの、構成性に欠けることが明らかになった。この課題に対処するため、計算量の法則の構成性を強化する効果的なファインチューニング手法を開発する。大規模な実証研究により、計算量の法則への適合度を高めることが、複数のベンチマークにおける推論性能の持続的向上をもたらし、さらに特性間および法則間の相乗効果を明らかにすることを実証する。プロジェクトページ:https://lore-project.github.io/
English
Despite the superior performance of Large Reasoning Models (LRMs), their reasoning behaviors are often counterintuitive, leading to suboptimal reasoning capabilities. To theoretically formalize the desired reasoning behaviors, this paper presents the Laws of Reasoning (LoRe), a unified framework that characterizes intrinsic reasoning patterns in LRMs. We first propose compute law with the hypothesis that the reasoning compute should scale linearly with question complexity. Beyond compute, we extend LoRe with a supplementary accuracy law. Since the question complexity is difficult to quantify in practice, we examine these hypotheses by two properties of the laws, monotonicity and compositionality. We therefore introduce LoRe-Bench, a benchmark that systematically measures these two tractable properties for large reasoning models. Evaluation shows that most reasoning models exhibit reasonable monotonicity but lack compositionality. In response, we develop an effective finetuning approach that enforces compute-law compositionality. Extensive empirical studies demonstrate that better compliance with compute laws yields consistently improved reasoning performance on multiple benchmarks, and uncovers synergistic effects across properties and laws. Project page: https://lore-project.github.io/