ChatPaper.aiChatPaper

Análise da Dinâmica da Cadeia de Pensamento: Orientação Ativa ou Racionalização Pós-hoc Infiel?

Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation?

August 27, 2025
Autores: Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, Nikolaos Aletras
cs.AI

Resumo

Trabalhos recentes demonstraram que a Cadeia de Pensamento (Chain-of-Thought, CoT) frequentemente gera ganhos limitados para problemas de raciocínio suave, como raciocínio analítico e de senso comum. Além disso, a CoT pode não ser fiel ao raciocínio real de um modelo. Investigamos a dinâmica e a fidelidade da CoT em tarefas de raciocínio suave em modelos ajustados por instrução, modelos de raciocínio e modelos destilados para raciocínio. Nossas descobertas revelam diferenças em como esses modelos dependem da CoT e mostram que a influência e a fidelidade da CoT nem sempre estão alinhadas.
English
Recent work has demonstrated that Chain-of-Thought (CoT) often yields limited gains for soft-reasoning problems such as analytical and commonsense reasoning. CoT can also be unfaithful to a model's actual reasoning. We investigate the dynamics and faithfulness of CoT in soft-reasoning tasks across instruction-tuned, reasoning and reasoning-distilled models. Our findings reveal differences in how these models rely on CoT, and show that CoT influence and faithfulness are not always aligned.
PDF322August 28, 2025