ChatPaper.aiChatPaper

Raciocínio em K Níveis com Modelos de Linguagem de Grande Escala

K-Level Reasoning with Large Language Models

February 2, 2024
Autores: Yadong Zhang, Shaoguang Mao, Tao Ge, Xun Wang, Yan Xia, Man Lan, Furu Wei
cs.AI

Resumo

Embora os Modelos de Linguagem de Grande Escala (LLMs) tenham demonstrado proficiência em tarefas de raciocínio complexo, seu desempenho em cenários dinâmicos, interativos e competitivos - como estratégia de negócios e análise do mercado de ações - permanece pouco explorado. Para preencher essa lacuna, exploramos formalmente as capacidades de raciocínio dinâmico dos LLMs para tomada de decisão em ambientes em rápida evolução. Introduzimos dois desafios piloto baseados em teoria dos jogos que refletem as complexidades da tomada de decisão dinâmica do mundo real. Esses desafios são bem definidos, permitindo uma avaliação clara, controlável e precisa das habilidades de raciocínio dinâmico dos LLMs. Por meio de experimentos extensivos, descobrimos que os métodos de raciocínio existentes tendem a falhar em configurações dinâmicas que exigem pensamento de nível k - um conceito-chave não abordado por trabalhos anteriores. Para resolver isso, propomos uma nova abordagem de raciocínio para LLMs, denominada "Raciocínio de Nível K". Essa abordagem adota a perspectiva dos rivais para empregar recursivamente o pensamento de nível k com base em informações históricas disponíveis, o que melhora significativamente a precisão da previsão dos movimentos subsequentes dos rivais e informa uma tomada de decisão mais estratégica. Esta pesquisa não apenas estabelece um benchmark quantitativo robusto para a avaliação do raciocínio dinâmico, mas também melhora marcadamente a proficiência dos LLMs em contextos dinâmicos.
English
While Large Language Models (LLMs) have demonstrated their proficiency in complex reasoning tasks, their performance in dynamic, interactive, and competitive scenarios - such as business strategy and stock market analysis - remains underexplored. To bridge this gap, we formally explore the dynamic reasoning capabilities of LLMs for decision-making in rapidly evolving environments. We introduce two game theory-based pilot challenges that mirror the complexities of real-world dynamic decision-making. These challenges are well-defined, enabling clear, controllable, and precise evaluation of LLMs' dynamic reasoning abilities. Through extensive experiments, we find that existing reasoning methods tend to falter in dynamic settings that require k-level thinking - a key concept not tackled by previous works. To address this, we propose a novel reasoning approach for LLMs, named "K-Level Reasoning". This approach adopts the perspective of rivals to recursively employ k-level thinking based on available historical information, which significantly improves the prediction accuracy of rivals' subsequent moves and informs more strategic decision-making. This research not only sets a robust quantitative benchmark for the assessment of dynamic reasoning but also markedly enhances the proficiency of LLMs in dynamic contexts.
PDF181December 15, 2024