ChatPaper.aiChatPaper

Всеобъемлющие Мысли: Преодоление закона треугольника Пенроуза в генерации мыслей

Everything of Thoughts: Defying the Law of Penrose Triangle for Thought Generation

November 7, 2023
Авторы: Ruomeng Ding, Chaoyun Zhang, Lu Wang, Yong Xu, Minghua Ma, Wei Zhang, Si Qin, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang
cs.AI

Аннотация

Последние достижения в области больших языковых моделей (LLM) произвели революцию в принятии решений, разбивая сложные задачи на более управляемые языковые последовательности, называемые «мыслями». Эффективный дизайн мыслей должен учитывать три ключевых аспекта: производительность, эффективность и гибкость. Однако существующие подходы к мыслям могут демонстрировать максимум два из этих атрибутов. Чтобы преодолеть эти ограничения, мы представляем новый подход к генерации мыслей под названием «Всеобъемлющие Мысли» (XoT), который бросает вызов закону «треугольника Пенроуза» существующих парадигм мышления. XoT использует предобученное обучение с подкреплением и метод поиска по дереву Монте-Карло (MCTS) для интеграции внешних знаний предметной области в мысли, тем самым расширяя возможности LLM и позволяя им эффективно обобщать решения для ранее не встречавшихся задач. Благодаря использованию совместного фреймворка пересмотра мыслей MCTS-LLM, этот подход автономно создает высококачественные когнитивные отображения с минимальным взаимодействием с LLM. Кроме того, XoT позволяет LLM осуществлять неограниченное мышление, обеспечивая гибкие когнитивные отображения для задач с множеством решений.
English
Recent advancements in Large Language Models (LLMs) have revolutionized decision-making by breaking down complex problems into more manageable language sequences referred to as ``thoughts''. An effective thought design should consider three key perspectives: performance, efficiency, and flexibility. However, existing thought can at most exhibit two of these attributes. To address these limitations, we introduce a novel thought prompting approach called ``Everything of Thoughts'' (XoT) to defy the law of ``Penrose triangle of existing thought paradigms. XoT leverages pretrained reinforcement learning and Monte Carlo Tree Search (MCTS) to incorporate external domain knowledge into thoughts, thereby enhancing LLMs' capabilities and enabling them to generalize to unseen problems efficiently. Through the utilization of the MCTS-LLM collaborative thought revision framework, this approach autonomously produces high-quality comprehensive cognitive mappings with minimal LLM interactions. Additionally, XoT empowers LLMs to engage in unconstrained thinking, allowing for flexible cognitive mappings for problems with multiple solutions.
PDF160December 15, 2024