ChatPaper.aiChatPaper

MITS: Улучшенное дерево поиска для рассуждений в больших языковых моделях с использованием точечной взаимной информации

MITS: Enhanced Tree Search Reasoning for LLMs via Pointwise Mutual Information

October 4, 2025
Авторы: Jiaxi Li, Yucheng Shi, Jin Lu, Ninghao Liu
cs.AI

Аннотация

Поиск по дереву стал репрезентативной основой для рассуждений во время тестирования с использованием больших языковых моделей (LLM), что иллюстрируется такими методами, как Tree-of-Thought и поиск по дереву Монте-Карло, которые исследуют множество путей рассуждений. Однако остается сложным предоставление мгновенной и надежной количественной оценки качества промежуточных шагов рассуждений, а обширное исследование путей требует значительных вычислительных ресурсов. Для решения этой проблемы мы предлагаем поиск по дереву на основе взаимной информации (MITS) — новую структуру, которая направляет рассуждения с использованием принципов теории информации. MITS вводит эффективную функцию оценки, основанную на точечной взаимной информации (PMI), что позволяет пошагово оценивать пути рассуждений и расширять дерево поиска с помощью поиска по лучу без дорогостоящих симуляций с опережением, достигая превосходных результатов в рассуждениях при сохранении вычислительной эффективности. Структура дополняется стратегией динамической выборки на основе энтропии, которая адаптивно распределяет вычислительные ресурсы на неопределенные шаги рассуждений, где исследование наиболее полезно. Для окончательного прогноза MITS использует взвешенную схему голосования, которая объединяет оценки PMI с консенсусом прогнозов. В ходе всесторонних экспериментов на различных тестах рассуждений MITS последовательно превосходит базовые методы, устанавливая принципиальную и эффективную основу для рассуждений с использованием LLM.
English
Tree search has become as a representative framework for test-time reasoning with large language models (LLMs), exemplified by methods such as Tree-of-Thought and Monte Carlo Tree Search that explore multiple reasoning paths. However, it remains difficult to provide instant and reliable quantitative assessments of intermediate reasoning step quality, and extensive path exploration is computationally costly. To address this, we propose Mutual Information Tree Search (MITS), a novel framework that guides reasoning with information-theoretic principles. MITS introduces an effective scoring function based on pointwise mutual information (PMI), which enables step-wise evaluation of reasoning paths and search tree expansion via beam search without expensive look-ahead simulations, achieving superior reasoning performances while maintaining computational efficiency. The framework is complemented by an entropy-based dynamic sampling strategy that adaptively allocates computational resources to uncertain reasoning steps where exploration is most beneficial. For final prediction, MITS employs a weighted voting scheme that combines PMI scores with prediction consensus. Through comprehensive experiments on diverse reasoning benchmarks, MITS consistently surpasses baseline methods, establishing a principled and efficient framework for LLM reasoning.
PDF382October 7, 2025