ChatPaper.aiChatPaper

STATe-of-Things: Strukturierte Aktionsvorlagen für den Baum-der-Gedanken

STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts

February 15, 2026
papers.authors: Zachary Bamberger, Till R. Saenger, Gilad Morad, Ofra Amir, Brandon M. Stewart, Amir Feder
cs.AI

papers.abstract

Inference-Time-Compute (ITC)-Methoden wie Best-of-N und Tree-of-Thoughts sollen Ausgabe-Kandidaten erzeugen, die sowohl hochwertig als auch vielfältig sind, doch ihre Verwendung von Hochtemperatur-Sampling führt oft nicht zu einer bedeutungsvollen Ausgabevielfalt. Darüber hinaus bieten bestehende ITC-Methoden nur begrenzte Kontrolle darüber, wie die Schlussfolgerung durchgeführt wird, was wiederum ihre Erklärbarkeit einschränkt. Wir stellen STATe-of-Thoughts (STATe) vor, eine interpretierbare ITC-Methode, die über hochrangige Denkmuster sucht. STATe ersetzt stochastisches Sampling durch diskrete und interpretierbare textuelle Interventionen: Ein Controller wählt Aktionen aus, die hochrangige Denkentscheidungen kodieren, ein Generator erzeugt darauf aufbauende Denkschritte, und ein Bewerter bewertet Kandidaten, um die Suche zu steuern. Dieser strukturierte Ansatz bietet drei Hauptvorteile. Erstens erzeugen aktionsgesteuerte textuelle Interventionen eine größere Antwortvielfalt als temperaturbasiertes Sampling. Zweitens erfasst in einer Fallstudie zur Argumentgenerierung die explizite Aktionsfolge von STATe interpretierbare Merkmale, die die Ausgabequalität hochgradig vorhersagbar machen. Drittens ermöglicht die Schätzung des Zusammenhangs zwischen Leistung und Aktionsauswahl, vielversprechende, aber unerforschte Regionen des Aktionsraums zu identifizieren und die Generierung direkt dorthin zu lenken. Zusammengenommen etablieren diese Ergebnisse STATe als praktisches Framework zur Erzeugung von hochwertigem, vielfältigem und interpretierbarem Text. Unser Framework ist verfügbar unter https://github.com/zbambergerNLP/state-of-thoughts.
English
Inference-Time-Compute (ITC) methods like Best-of-N and Tree-of-Thoughts are meant to produce output candidates that are both high-quality and diverse, but their use of high-temperature sampling often fails to achieve meaningful output diversity. Moreover, existing ITC methods offer limited control over how to perform reasoning, which in turn limits their explainability. We present STATe-of-Thoughts (STATe), an interpretable ITC method that searches over high-level reasoning patterns. STATe replaces stochastic sampling with discrete and interpretable textual interventions: a controller selects actions encoding high-level reasoning choices, a generator produces reasoning steps conditioned on those choices, and an evaluator scores candidates to guide search. This structured approach yields three main advantages. First, action-guided textual interventions produce greater response diversity than temperature-based sampling. Second, in a case study on argument generation, STATe's explicit action sequences capture interpretable features that are highly predictive of output quality. Third, estimating the association between performance and action choices allows us to identify promising yet unexplored regions of the action space and steer generation directly toward them. Together, these results establish STATe as a practical framework for generating high-quality, diverse, and interpretable text. Our framework is available at https://github.com/zbambergerNLP/state-of-thoughts.
PDF183February 18, 2026