ChatPaper.aiChatPaper

Многоуровневое рассуждение с использованием больших языковых моделей

K-Level Reasoning with Large Language Models

February 2, 2024
Авторы: Yadong Zhang, Shaoguang Mao, Tao Ge, Xun Wang, Yan Xia, Man Lan, Furu Wei
cs.AI

Аннотация

Хотя крупные языковые модели (LLMs) продемонстрировали свою эффективность в задачах сложного рассуждения, их производительность в динамичных, интерактивных и конкурентных сценариях — таких как бизнес-стратегия и анализ фондового рынка — остается недостаточно изученной. Чтобы устранить этот пробел, мы формально исследуем способности LLMs к динамическому рассуждению для принятия решений в быстро меняющихся условиях. Мы представляем два пилотных испытания, основанных на теории игр, которые отражают сложность реального динамического принятия решений. Эти испытания четко определены, что позволяет проводить ясную, контролируемую и точную оценку динамических способностей рассуждения LLMs. В ходе обширных экспериментов мы обнаруживаем, что существующие методы рассуждения склонны давать сбои в динамичных условиях, требующих k-уровневого мышления — ключевой концепции, не затронутой в предыдущих работах. Для решения этой проблемы мы предлагаем новый подход к рассуждению для LLMs, названный "K-Level Reasoning". Этот подход принимает точку зрения соперников, чтобы рекурсивно применять k-уровневое мышление на основе доступной исторической информации, что значительно повышает точность прогнозирования последующих действий соперников и способствует более стратегическому принятию решений. Это исследование не только устанавливает надежный количественный эталон для оценки динамического рассуждения, но и существенно повышает эффективность LLMs в динамичных контекстах.
English
While Large Language Models (LLMs) have demonstrated their proficiency in complex reasoning tasks, their performance in dynamic, interactive, and competitive scenarios - such as business strategy and stock market analysis - remains underexplored. To bridge this gap, we formally explore the dynamic reasoning capabilities of LLMs for decision-making in rapidly evolving environments. We introduce two game theory-based pilot challenges that mirror the complexities of real-world dynamic decision-making. These challenges are well-defined, enabling clear, controllable, and precise evaluation of LLMs' dynamic reasoning abilities. Through extensive experiments, we find that existing reasoning methods tend to falter in dynamic settings that require k-level thinking - a key concept not tackled by previous works. To address this, we propose a novel reasoning approach for LLMs, named "K-Level Reasoning". This approach adopts the perspective of rivals to recursively employ k-level thinking based on available historical information, which significantly improves the prediction accuracy of rivals' subsequent moves and informs more strategic decision-making. This research not only sets a robust quantitative benchmark for the assessment of dynamic reasoning but also markedly enhances the proficiency of LLMs in dynamic contexts.
PDF181December 15, 2024