Hilo del Pensamiento Desentrañando Contextos Caóticos
Thread of Thought Unraveling Chaotic Contexts
November 15, 2023
Autores: Yucheng Zhou, Xiubo Geng, Tao Shen, Chongyang Tao, Guodong Long, Jian-Guang Lou, Jianbing Shen
cs.AI
Resumen
Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han marcado el inicio de una era transformadora en el campo del procesamiento del lenguaje natural, destacándose en tareas relacionadas con la comprensión y generación de texto. Sin embargo, enfrentan dificultades cuando se encuentran con contextos caóticos (por ejemplo, distractores en lugar de contextos irrelevantes extensos), lo que lleva a la omisión involuntaria de ciertos detalles dentro de dicho contexto caótico. Para abordar estos desafíos, presentamos la estrategia "Hilo de Pensamiento" (ThoT, por sus siglas en inglés), que se inspira en los procesos cognitivos humanos. ThoT segmenta y analiza sistemáticamente contextos extensos mientras selecciona hábilmente la información relevante. Esta estrategia funciona como un módulo versátil "plug-and-play", integrándose sin problemas con diversos LLMs y técnicas de prompting. En los experimentos, utilizamos los conjuntos de datos PopQA y EntityQ, así como un conjunto de datos de Respuestas en Conversaciones de Múltiples Turnos (MTCR) que recopilamos, para demostrar que ThoT mejora significativamente el rendimiento del razonamiento en comparación con otras técnicas de prompting.
English
Large Language Models (LLMs) have ushered in a transformative era in the
field of natural language processing, excelling in tasks related to text
comprehension and generation. Nevertheless, they encounter difficulties when
confronted with chaotic contexts (e.g., distractors rather than long irrelevant
context), leading to the inadvertent omission of certain details within the
chaotic context. In response to these challenges, we introduce the "Thread of
Thought" (ThoT) strategy, which draws inspiration from human cognitive
processes. ThoT systematically segments and analyzes extended contexts while
adeptly selecting pertinent information. This strategy serves as a versatile
"plug-and-play" module, seamlessly integrating with various LLMs and prompting
techniques. In the experiments, we utilize the PopQA and EntityQ datasets, as
well as a Multi-Turn Conversation Response dataset (MTCR) we collected, to
illustrate that ThoT significantly improves reasoning performance compared to
other prompting techniques.