Всеобъемлющие Мысли: Преодоление закона треугольника Пенроуза в генерации мыслей
Everything of Thoughts: Defying the Law of Penrose Triangle for Thought Generation
November 7, 2023
Авторы: Ruomeng Ding, Chaoyun Zhang, Lu Wang, Yong Xu, Minghua Ma, Wei Zhang, Si Qin, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang
cs.AI
Аннотация
Последние достижения в области больших языковых моделей (LLM) произвели революцию в принятии решений, разбивая сложные задачи на более управляемые языковые последовательности, называемые «мыслями». Эффективный дизайн мыслей должен учитывать три ключевых аспекта: производительность, эффективность и гибкость. Однако существующие подходы к мыслям могут демонстрировать максимум два из этих атрибутов. Чтобы преодолеть эти ограничения, мы представляем новый подход к генерации мыслей под названием «Всеобъемлющие Мысли» (XoT), который бросает вызов закону «треугольника Пенроуза» существующих парадигм мышления. XoT использует предобученное обучение с подкреплением и метод поиска по дереву Монте-Карло (MCTS) для интеграции внешних знаний предметной области в мысли, тем самым расширяя возможности LLM и позволяя им эффективно обобщать решения для ранее не встречавшихся задач. Благодаря использованию совместного фреймворка пересмотра мыслей MCTS-LLM, этот подход автономно создает высококачественные когнитивные отображения с минимальным взаимодействием с LLM. Кроме того, XoT позволяет LLM осуществлять неограниченное мышление, обеспечивая гибкие когнитивные отображения для задач с множеством решений.
English
Recent advancements in Large Language Models (LLMs) have revolutionized
decision-making by breaking down complex problems into more manageable language
sequences referred to as ``thoughts''. An effective thought design should
consider three key perspectives: performance, efficiency, and flexibility.
However, existing thought can at most exhibit two of these attributes. To
address these limitations, we introduce a novel thought prompting approach
called ``Everything of Thoughts'' (XoT) to defy the law of ``Penrose triangle
of existing thought paradigms. XoT leverages pretrained reinforcement learning
and Monte Carlo Tree Search (MCTS) to incorporate external domain knowledge
into thoughts, thereby enhancing LLMs' capabilities and enabling them to
generalize to unseen problems efficiently. Through the utilization of the
MCTS-LLM collaborative thought revision framework, this approach autonomously
produces high-quality comprehensive cognitive mappings with minimal LLM
interactions. Additionally, XoT empowers LLMs to engage in unconstrained
thinking, allowing for flexible cognitive mappings for problems with multiple
solutions.