Цепочка черновиков: Думать быстрее, записывая меньше
Chain of Draft: Thinking Faster by Writing Less
February 25, 2025
Авторы: Silei Xu, Wenhao Xie, Lingxiao Zhao, Pengcheng He
cs.AI
Аннотация
Крупные языковые модели (LLM) продемонстрировали выдающиеся результаты в решении сложных задач на рассуждение благодаря таким механизмам, как Chain-of-Thought (CoT) prompting, который делает акцент на подробном, пошаговом рассуждении. Однако люди обычно используют более эффективную стратегию: создание кратких промежуточных мыслей, фиксирующих только ключевую информацию. В данной работе мы предлагаем Chain of Draft (CoD) — новую парадигму, вдохновлённую когнитивными процессами человека, в рамках которой LLM генерируют минималистичные, но информативные промежуточные результаты рассуждений при решении задач. Снижая избыточность и фокусируясь на ключевых инсайтах, CoD достигает или превосходит точность CoT, используя всего 7,6% токенов, что значительно сокращает затраты и задержки при выполнении различных задач на рассуждение.
English
Large Language Models (LLMs) have demonstrated remarkable performance in
solving complex reasoning tasks through mechanisms like Chain-of-Thought (CoT)
prompting, which emphasizes verbose, step-by-step reasoning. However, humans
typically employ a more efficient strategy: drafting concise intermediate
thoughts that capture only essential information. In this work, we propose
Chain of Draft (CoD), a novel paradigm inspired by human cognitive processes,
where LLMs generate minimalistic yet informative intermediate reasoning outputs
while solving tasks. By reducing verbosity and focusing on critical insights,
CoD matches or surpasses CoT in accuracy while using as little as only 7.6% of
the tokens, significantly reducing cost and latency across various reasoning
tasks.Summary
AI-Generated Summary