Árbol de Pensamientos: Resolución de Problemas Deliberada con Modelos de Lenguaje a Gran Escala

Resumen

Los modelos de lenguaje se están implementando cada vez más para la resolución general de problemas en una amplia gama de tareas, pero aún están limitados a procesos de toma de decisiones a nivel de tokens, de izquierda a derecha, durante la inferencia. Esto significa que pueden fallar en tareas que requieren exploración, anticipación estratégica o donde las decisiones iniciales juegan un papel crucial. Para superar estos desafíos, presentamos un nuevo marco para la inferencia de modelos de lenguaje, Árbol de Pensamientos (Tree of Thoughts, ToT), que generaliza el enfoque popular de Cadena de Pensamiento (Chain of Thought) para la activación de modelos de lenguaje y permite la exploración sobre unidades coherentes de texto (pensamientos) que sirven como pasos intermedios hacia la resolución de problemas. ToT permite a los modelos de lenguaje realizar una toma de decisiones deliberada al considerar múltiples rutas de razonamiento y autoevaluar las opciones para decidir el siguiente curso de acción, así como anticipar o retroceder cuando sea necesario para tomar decisiones globales. Nuestros experimentos muestran que ToT mejora significativamente las habilidades de resolución de problemas de los modelos de lenguaje en tres tareas novedosas que requieren planificación o búsqueda no trivial: Juego del 24, Escritura Creativa y Mini Crucigramas. Por ejemplo, en el Juego del 24, mientras que GPT-4 con activación de cadena de pensamiento solo resolvió el 4% de las tareas, nuestro método logró una tasa de éxito del 74%. Repositorio de código con todos los prompts: https://github.com/ysymyth/tree-of-thought-llm.

English

Language models are increasingly being deployed for general problem solving across a wide range of tasks, but are still confined to token-level, left-to-right decision-making processes during inference. This means they can fall short in tasks that require exploration, strategic lookahead, or where initial decisions play a pivotal role. To surmount these challenges, we introduce a new framework for language model inference, Tree of Thoughts (ToT), which generalizes over the popular Chain of Thought approach to prompting language models, and enables exploration over coherent units of text (thoughts) that serve as intermediate steps toward problem solving. ToT allows LMs to perform deliberate decision making by considering multiple different reasoning paths and self-evaluating choices to decide the next course of action, as well as looking ahead or backtracking when necessary to make global choices. Our experiments show that ToT significantly enhances language models' problem-solving abilities on three novel tasks requiring non-trivial planning or search: Game of 24, Creative Writing, and Mini Crosswords. For instance, in Game of 24, while GPT-4 with chain-of-thought prompting only solved 4% of tasks, our method achieved a success rate of 74%. Code repo with all prompts: https://github.com/ysymyth/tree-of-thought-llm.

Árbol de Pensamientos: Resolución de Problemas Deliberada con Modelos de Lenguaje a Gran Escala

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Resumen

Support