Analisi della Dinamica del Ragionamento a Catena: Guida Attiva o Razionalizzazione Post-hoc Infedele?
Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation?
August 27, 2025
Autori: Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, Nikolaos Aletras
cs.AI
Abstract
Recenti lavori hanno dimostrato che il Chain-of-Thought (CoT) spesso produce guadagni limitati per problemi di ragionamento soft, come il ragionamento analitico e di senso comune. Inoltre, il CoT può non essere fedele al ragionamento effettivo di un modello. Investigiamo le dinamiche e la fedeltà del CoT in compiti di ragionamento soft attraverso modelli ottimizzati per istruzioni, modelli di ragionamento e modelli distillati per il ragionamento. I nostri risultati rivelano differenze nel modo in cui questi modelli si affidano al CoT e mostrano che l'influenza e la fedeltà del CoT non sono sempre allineate.
English
Recent work has demonstrated that Chain-of-Thought (CoT) often yields limited
gains for soft-reasoning problems such as analytical and commonsense reasoning.
CoT can also be unfaithful to a model's actual reasoning. We investigate the
dynamics and faithfulness of CoT in soft-reasoning tasks across
instruction-tuned, reasoning and reasoning-distilled models. Our findings
reveal differences in how these models rely on CoT, and show that CoT influence
and faithfulness are not always aligned.