ChatPaper.aiChatPaper

Raisonnement à Niveaux K avec les Modèles de Langage à Grande Échelle

K-Level Reasoning with Large Language Models

February 2, 2024
Auteurs: Yadong Zhang, Shaoguang Mao, Tao Ge, Xun Wang, Yan Xia, Man Lan, Furu Wei
cs.AI

Résumé

Bien que les modèles de langage de grande taille (LLMs) aient démontré leur compétence dans des tâches de raisonnement complexe, leurs performances dans des scénarios dynamiques, interactifs et compétitifs – tels que la stratégie d'entreprise et l'analyse des marchés boursiers – restent peu explorées. Pour combler cette lacune, nous explorons formellement les capacités de raisonnement dynamique des LLMs pour la prise de décision dans des environnements en évolution rapide. Nous introduisons deux défis pilotes basés sur la théorie des jeux qui reflètent les complexités de la prise de décision dynamique dans le monde réel. Ces défis sont bien définis, permettant une évaluation claire, contrôlable et précise des capacités de raisonnement dynamique des LLMs. À travers des expériences approfondies, nous constatons que les méthodes de raisonnement existantes tendent à faiblir dans des contextes dynamiques nécessitant une pensée de niveau k – un concept clé non abordé par les travaux précédents. Pour remédier à cela, nous proposons une nouvelle approche de raisonnement pour les LLMs, nommée « Raisonnement de Niveau K ». Cette approche adopte la perspective des rivaux pour appliquer de manière récursive une pensée de niveau k basée sur les informations historiques disponibles, ce qui améliore significativement la précision de la prédiction des mouvements ultérieurs des rivaux et éclaire une prise de décision plus stratégique. Cette recherche établit non seulement un benchmark quantitatif robuste pour l'évaluation du raisonnement dynamique, mais améliore également de manière notable la compétence des LLMs dans des contextes dynamiques.
English
While Large Language Models (LLMs) have demonstrated their proficiency in complex reasoning tasks, their performance in dynamic, interactive, and competitive scenarios - such as business strategy and stock market analysis - remains underexplored. To bridge this gap, we formally explore the dynamic reasoning capabilities of LLMs for decision-making in rapidly evolving environments. We introduce two game theory-based pilot challenges that mirror the complexities of real-world dynamic decision-making. These challenges are well-defined, enabling clear, controllable, and precise evaluation of LLMs' dynamic reasoning abilities. Through extensive experiments, we find that existing reasoning methods tend to falter in dynamic settings that require k-level thinking - a key concept not tackled by previous works. To address this, we propose a novel reasoning approach for LLMs, named "K-Level Reasoning". This approach adopts the perspective of rivals to recursively employ k-level thinking based on available historical information, which significantly improves the prediction accuracy of rivals' subsequent moves and informs more strategic decision-making. This research not only sets a robust quantitative benchmark for the assessment of dynamic reasoning but also markedly enhances the proficiency of LLMs in dynamic contexts.
PDF181December 15, 2024