Tout sur les Pensées : Défier la Loi du Triangle de Penrose pour la Génération de Pensées
Everything of Thoughts: Defying the Law of Penrose Triangle for Thought Generation
November 7, 2023
Auteurs: Ruomeng Ding, Chaoyun Zhang, Lu Wang, Yong Xu, Minghua Ma, Wei Zhang, Si Qin, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang
cs.AI
Résumé
Les récentes avancées dans les modèles de langage à grande échelle (LLMs) ont révolutionné la prise de décision en décomposant des problèmes complexes en séquences linguistiques plus gérables, appelées « pensées ». Une conception efficace des pensées doit prendre en compte trois perspectives clés : la performance, l'efficacité et la flexibilité. Cependant, les pensées existantes ne peuvent au mieux présenter que deux de ces attributs. Pour surmonter ces limitations, nous introduisons une nouvelle approche de stimulation des pensées appelée « Tout des Pensées » (XoT), qui défie la loi du « triangle de Penrose des paradigmes de pensée existants ». XoT exploite l'apprentissage par renforcement pré-entraîné et la recherche arborescente de Monte Carlo (MCTS) pour intégrer des connaissances externes du domaine dans les pensées, améliorant ainsi les capacités des LLMs et leur permettant de généraliser efficacement à des problèmes inédits. Grâce à l'utilisation du cadre de révision collaborative des pensées MCTS-LLM, cette approche produit de manière autonome des cartes cognitives complètes et de haute qualité avec un minimum d'interactions LLM. De plus, XoT permet aux LLMs de s'engager dans une pensée sans contraintes, autorisant des cartes cognitives flexibles pour des problèmes à solutions multiples.
English
Recent advancements in Large Language Models (LLMs) have revolutionized
decision-making by breaking down complex problems into more manageable language
sequences referred to as ``thoughts''. An effective thought design should
consider three key perspectives: performance, efficiency, and flexibility.
However, existing thought can at most exhibit two of these attributes. To
address these limitations, we introduce a novel thought prompting approach
called ``Everything of Thoughts'' (XoT) to defy the law of ``Penrose triangle
of existing thought paradigms. XoT leverages pretrained reinforcement learning
and Monte Carlo Tree Search (MCTS) to incorporate external domain knowledge
into thoughts, thereby enhancing LLMs' capabilities and enabling them to
generalize to unseen problems efficiently. Through the utilization of the
MCTS-LLM collaborative thought revision framework, this approach autonomously
produces high-quality comprehensive cognitive mappings with minimal LLM
interactions. Additionally, XoT empowers LLMs to engage in unconstrained
thinking, allowing for flexible cognitive mappings for problems with multiple
solutions.