SQuARE: Motor de Razonamiento de Preguntas y Respuestas Secuenciales para Mejorar la Cadena de Pensamiento en Modelos de Lenguaje Grandes

Resumen

En el campo en constante evolución del Procesamiento del Lenguaje Natural, los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) se enfrentan a desafíos de razonamiento cada vez más complejos. Métodos tradicionales como la generación de cadenas de pensamiento han mostrado promesa, pero a menudo no logran aprovechar completamente las capacidades de razonamiento de un modelo. Este artículo presenta SQuARE (Motor de Razonamiento de Preguntas y Respuestas Secuenciales), una técnica de generación de estímulos novedosa diseñada para mejorar el razonamiento a través de un paradigma de auto-interrogación. Basándose en los marcos de CoT, SQuARE estimula a los modelos a generar y resolver múltiples preguntas auxiliares antes de abordar la consulta principal, fomentando una exploración más exhaustiva de varios aspectos de un tema. Nuestras extensas evaluaciones, realizadas con los modelos Llama 3 y GPT-4o en múltiples conjuntos de datos de preguntas y respuestas, demuestran que SQuARE supera significativamente a los estímulos tradicionales de CoT y a los métodos existentes de reformulación y respuesta. Al descomponer sistemáticamente las consultas, SQuARE mejora las capacidades de los LLM en tareas de razonamiento. El código está disponible públicamente en https://github.com/IntelLabs/RAG-FiT/tree/square.

English

In the rapidly evolving field of Natural Language Processing, Large Language Models (LLMs) are tasked with increasingly complex reasoning challenges. Traditional methods like chain-of-thought prompting have shown promise but often fall short in fully leveraging a model's reasoning capabilities. This paper introduces SQuARE (Sequential Question Answering Reasoning Engine), a novel prompting technique designed to improve reasoning through a self-interrogation paradigm. Building upon CoT frameworks, SQuARE prompts models to generate and resolve multiple auxiliary questions before tackling the main query, promoting a more thorough exploration of various aspects of a topic. Our expansive evaluations, conducted with Llama 3 and GPT-4o models across multiple question-answering datasets, demonstrate that SQuARE significantly surpasses traditional CoT prompts and existing rephrase-and-respond methods. By systematically decomposing queries, SQuARE advances LLM capabilities in reasoning tasks. The code is publicly available at https://github.com/IntelLabs/RAG-FiT/tree/square.

SQuARE: Motor de Razonamiento de Preguntas y Respuestas Secuenciales para Mejorar la Cadena de Pensamiento en Modelos de Lenguaje Grandes

SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models

Resumen

Support