Raisonnement à Niveaux K avec les Modèles de Langage à Grande Échelle
K-Level Reasoning with Large Language Models
February 2, 2024
Auteurs: Yadong Zhang, Shaoguang Mao, Tao Ge, Xun Wang, Yan Xia, Man Lan, Furu Wei
cs.AI
Résumé
Bien que les modèles de langage de grande taille (LLMs) aient démontré leur compétence dans des tâches de raisonnement complexe, leurs performances dans des scénarios dynamiques, interactifs et compétitifs – tels que la stratégie d'entreprise et l'analyse des marchés boursiers – restent peu explorées. Pour combler cette lacune, nous explorons formellement les capacités de raisonnement dynamique des LLMs pour la prise de décision dans des environnements en évolution rapide. Nous introduisons deux défis pilotes basés sur la théorie des jeux qui reflètent les complexités de la prise de décision dynamique dans le monde réel. Ces défis sont bien définis, permettant une évaluation claire, contrôlable et précise des capacités de raisonnement dynamique des LLMs. À travers des expériences approfondies, nous constatons que les méthodes de raisonnement existantes tendent à faiblir dans des contextes dynamiques nécessitant une pensée de niveau k – un concept clé non abordé par les travaux précédents. Pour remédier à cela, nous proposons une nouvelle approche de raisonnement pour les LLMs, nommée « Raisonnement de Niveau K ». Cette approche adopte la perspective des rivaux pour appliquer de manière récursive une pensée de niveau k basée sur les informations historiques disponibles, ce qui améliore significativement la précision de la prédiction des mouvements ultérieurs des rivaux et éclaire une prise de décision plus stratégique. Cette recherche établit non seulement un benchmark quantitatif robuste pour l'évaluation du raisonnement dynamique, mais améliore également de manière notable la compétence des LLMs dans des contextes dynamiques.
English
While Large Language Models (LLMs) have demonstrated their proficiency in
complex reasoning tasks, their performance in dynamic, interactive, and
competitive scenarios - such as business strategy and stock market analysis -
remains underexplored. To bridge this gap, we formally explore the dynamic
reasoning capabilities of LLMs for decision-making in rapidly evolving
environments. We introduce two game theory-based pilot challenges that mirror
the complexities of real-world dynamic decision-making. These challenges are
well-defined, enabling clear, controllable, and precise evaluation of LLMs'
dynamic reasoning abilities. Through extensive experiments, we find that
existing reasoning methods tend to falter in dynamic settings that require
k-level thinking - a key concept not tackled by previous works. To address
this, we propose a novel reasoning approach for LLMs, named "K-Level
Reasoning". This approach adopts the perspective of rivals to recursively
employ k-level thinking based on available historical information, which
significantly improves the prediction accuracy of rivals' subsequent moves and
informs more strategic decision-making. This research not only sets a robust
quantitative benchmark for the assessment of dynamic reasoning but also
markedly enhances the proficiency of LLMs in dynamic contexts.