Cadeia de Pensamento Auto-Harmonizada

Resumo

A técnica de estímulo Chain-of-Thought (CoT) revela que grandes modelos de linguagem são capazes de realizar raciocínio complexo por meio de etapas intermediárias. A técnica CoT é principalmente categorizada em três abordagens. A primeira abordagem utiliza estímulos diretos como "Vamos pensar passo a passo" para gerar um processo de pensamento sequencial antes de fornecer uma resposta. A segunda abordagem faz uso de demonstrações humanas elaboradas passo a passo para orientar o processo de raciocínio do modelo. A terceira automatiza a geração de demonstrações fundamentadas com o 'Vamos pensar passo a passo'. Essa abordagem às vezes resulta em erros de raciocínio, destacando a necessidade de diversificar as demonstrações para mitigar seus efeitos enganosos. No entanto, demonstrações diversas apresentam desafios para representações eficazes. Neste trabalho, propomos o ECHO, um método de estímulo de cadeia de pensamento auto-harmonizado. Ele consolida diferentes caminhos de solução em um padrão de solução uniforme e eficaz. O ECHO demonstra o melhor desempenho geral em três domínios de raciocínio.

English

Chain-of-Thought (CoT) prompting reveals that large language models are capable of performing complex reasoning via intermediate steps. CoT prompting is primarily categorized into three approaches. The first approach utilizes straightforward prompts like ``Let's think step by step'' to generate a sequential thought process before yielding an answer. The second approach makes use of human-crafted, step-by-step demonstrations to guide the model's reasoning process. The third automates the generation of reasoned demonstrations with the 'Let's think step by step'.This approach sometimes leads to reasoning errors, highlighting the need to diversify demonstrations to mitigate its misleading effects. However, diverse demonstrations pose challenges for effective representations. In this work, we propose ECHO, a self-harmonized chain-of-thought prompting method. It consolidates diverse solution paths into a uniform and effective solution pattern.ECHO demonstrates the best overall performance across three reasoning domains.

Cadeia de Pensamento Auto-Harmonizada

Self-Harmonized Chain of Thought

Resumo

Support