Filamento del Pensiero che Svela Contesti Caotici
Thread of Thought Unraveling Chaotic Contexts
November 15, 2023
Autori: Yucheng Zhou, Xiubo Geng, Tao Shen, Chongyang Tao, Guodong Long, Jian-Guang Lou, Jianbing Shen
cs.AI
Abstract
I Large Language Models (LLMs) hanno inaugurato un'era trasformativa nel campo dell'elaborazione del linguaggio naturale, eccellendo in compiti legati alla comprensione e alla generazione di testo. Tuttavia, incontrano difficoltà quando si confrontano con contesti caotici (ad esempio, distrattori piuttosto che contesti lunghi e irrilevanti), portando all'omissione involontaria di alcuni dettagli all'interno del contesto caotico. In risposta a queste sfide, introduciamo la strategia "Thread of Thought" (ThoT), che trae ispirazione dai processi cognitivi umani. ThoT segmenta e analizza sistematicamente contesti estesi, selezionando abilmente le informazioni pertinenti. Questa strategia funge da modulo versatile "plug-and-play", integrandosi perfettamente con vari LLM e tecniche di prompting. Negli esperimenti, utilizziamo i dataset PopQA e EntityQ, nonché un dataset di risposte a conversazioni multi-turn (MTCR) da noi raccolto, per dimostrare che ThoT migliora significativamente le prestazioni di ragionamento rispetto ad altre tecniche di prompting.
English
Large Language Models (LLMs) have ushered in a transformative era in the
field of natural language processing, excelling in tasks related to text
comprehension and generation. Nevertheless, they encounter difficulties when
confronted with chaotic contexts (e.g., distractors rather than long irrelevant
context), leading to the inadvertent omission of certain details within the
chaotic context. In response to these challenges, we introduce the "Thread of
Thought" (ThoT) strategy, which draws inspiration from human cognitive
processes. ThoT systematically segments and analyzes extended contexts while
adeptly selecting pertinent information. This strategy serves as a versatile
"plug-and-play" module, seamlessly integrating with various LLMs and prompting
techniques. In the experiments, we utilize the PopQA and EntityQ datasets, as
well as a Multi-Turn Conversation Response dataset (MTCR) we collected, to
illustrate that ThoT significantly improves reasoning performance compared to
other prompting techniques.