ChatPaper.aiChatPaper

STATe-of-Thoughts: Plantillas de Acción Estructurada para Árbol de Pensamientos

STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts

February 15, 2026
Autores: Zachary Bamberger, Till R. Saenger, Gilad Morad, Ofra Amir, Brandon M. Stewart, Amir Feder
cs.AI

Resumen

Los métodos de Cómputo en Tiempo de Inferencia (ITC) como Best-of-N y Tree-of-Thoughts están diseñados para producir candidatos de salida que sean tanto de alta calidad como diversos, pero su uso de muestreo con alta temperatura a menudo no logra alcanzar una diversidad de salida significativa. Además, los métodos ITC existentes ofrecen un control limitado sobre cómo realizar el razonamiento, lo que a su vez limita su explicabilidad. Presentamos STATe-of-Thoughts (STATe), un método ITC interpretable que busca patrones de razonamiento de alto nivel. STATe reemplaza el muestreo estocástico con intervenciones textuales discretas e interpretables: un controlador selecciona acciones que codifican elecciones de razonamiento de alto nivel, un generador produce pasos de razonamiento condicionados por esas elecciones, y un evaluador puntúa a los candidatos para guiar la búsqueda. Este enfoque estructurado ofrece tres ventajas principales. Primero, las intervenciones textuales guiadas por acciones producen una mayor diversidad de respuestas que el muestreo basado en temperatura. Segundo, en un estudio de caso sobre generación de argumentos, las secuencias de acciones explícitas de STATe capturan características interpretables que son altamente predictivas de la calidad de la salida. Tercero, estimar la asociación entre el rendimiento y las elecciones de acción nos permite identificar regiones prometedoras pero inexploradas del espacio de acciones y dirigir la generación directamente hacia ellas. En conjunto, estos resultados establecen a STATe como un marco práctico para generar texto de alta calidad, diverso e interpretable. Nuestro marco está disponible en https://github.com/zbambergerNLP/state-of-thoughts.
English
Inference-Time-Compute (ITC) methods like Best-of-N and Tree-of-Thoughts are meant to produce output candidates that are both high-quality and diverse, but their use of high-temperature sampling often fails to achieve meaningful output diversity. Moreover, existing ITC methods offer limited control over how to perform reasoning, which in turn limits their explainability. We present STATe-of-Thoughts (STATe), an interpretable ITC method that searches over high-level reasoning patterns. STATe replaces stochastic sampling with discrete and interpretable textual interventions: a controller selects actions encoding high-level reasoning choices, a generator produces reasoning steps conditioned on those choices, and an evaluator scores candidates to guide search. This structured approach yields three main advantages. First, action-guided textual interventions produce greater response diversity than temperature-based sampling. Second, in a case study on argument generation, STATe's explicit action sequences capture interpretable features that are highly predictive of output quality. Third, estimating the association between performance and action choices allows us to identify promising yet unexplored regions of the action space and steer generation directly toward them. Together, these results establish STATe as a practical framework for generating high-quality, diverse, and interpretable text. Our framework is available at https://github.com/zbambergerNLP/state-of-thoughts.
PDF183February 18, 2026