ChatPaper.aiChatPaper

言語モデルにおけるドメイン外汎化を誘発する基礎的推論パラダイム

Fundamental Reasoning Paradigms Induce Out-of-Domain Generalization in Language Models

February 9, 2026
著者: Mingzi Cao, Xingwei Tan, Mahmud Akhter, Marco Valentino, Maria Liakata, Xi Wang, Nikolaos Aletras
cs.AI

要旨

演繹、帰納、アブダクションは、人間の論理的思考の中核をなす基本的な推論パラダイムである。大規模言語モデル(LLM)の推論能力向上には多大な研究努力が払われているが、これらの基本パラダイムが一般化をどの程度誘導するかは、体系的に検証されていなかった。本研究では、これらの核心的パラダイム間の相互作用がLLMの推論行動に与える影響を明らかにする。まず、具体的な世界知識を抽象化するため、3つの基本パラダイムのそれぞれを対象とした記号論理タスクからなる新しい推論軌跡データセットを構築した。次に、これらのスキルをLLMに誘導する効果的手法を検討する。単純なファインチューニングから、モデル深度の増加や密なモデルから専門家混合モデルへの変換といった複雑な手法まで、様々な方法を実験した。現実的な知識を含み自然言語で完全に形式化された実世界の領域外タスクにおいて、誘導されたモデルを包括的に評価した結果、本アプローチが実践タスク全体で大幅な性能向上(最大14.60ポイント)を伴う強力な一般化能力を生み出すことが明らかとなった。
English
Deduction, induction, and abduction are fundamental reasoning paradigms, core for human logical thinking. Although improving Large Language Model (LLM) reasoning has attracted significant research efforts, the extent to which the fundamental paradigms induce generalization has yet to be systematically explored. In this study, we shed light on how the interplay between these core paradigms influences LLMs' reasoning behavior. To this end, we first collect a new dataset of reasoning trajectories from symbolic tasks, each targeting one of the three fundamental paradigms, to abstract from concrete world knowledge. Then, we investigate effective ways for inducing these skills into LLMs. We experiment with a battery of methods including simple fine-tuning, and more complex approaches to increase model depth, or transform a dense model to a mixture-of-experts. We comprehensively evaluate induced models on realistic out-of-domain tasks, that are entirely formulated in natural language and contain real-world knowledge. Our results reveal that our approach yields strong generalizability with substantial performance gains (up to 14.60) across realistic tasks.
PDF122February 11, 2026