ChatPaper.aiChatPaper

Analyse der Dynamik von Gedankenketten: Aktive Lenkung oder unzuverlässige nachträgliche Rationalisierung?

Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation?

August 27, 2025
papers.authors: Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, Nikolaos Aletras
cs.AI

papers.abstract

Aktuelle Arbeiten haben gezeigt, dass Chain-of-Thought (CoT) bei Soft-Reasoning-Problemen wie analytischem und gesundem Menschenverstand oft nur begrenzte Verbesserungen bringt. CoT kann zudem nicht immer die tatsächliche Denkweise eines Modells widerspiegeln. Wir untersuchen die Dynamik und Treue von CoT bei Soft-Reasoning-Aufgaben in instruction-tuned, Reasoning- und Reasoning-distilled-Modellen. Unsere Ergebnisse zeigen Unterschiede darin, wie diese Modelle auf CoT zurückgreifen, und verdeutlichen, dass der Einfluss von CoT und seine Treue nicht immer übereinstimmen.
English
Recent work has demonstrated that Chain-of-Thought (CoT) often yields limited gains for soft-reasoning problems such as analytical and commonsense reasoning. CoT can also be unfaithful to a model's actual reasoning. We investigate the dynamics and faithfulness of CoT in soft-reasoning tasks across instruction-tuned, reasoning and reasoning-distilled models. Our findings reveal differences in how these models rely on CoT, and show that CoT influence and faithfulness are not always aligned.
PDF262August 28, 2025