Landscape of Thoughts: Visualisierung des Denkprozesses von großen Sprachmodellen
Landscape of Thoughts: Visualizing the Reasoning Process of Large Language Models
March 28, 2025
Autoren: Zhanke Zhou, Zhaocheng Zhu, Xuan Li, Mikhail Galkin, Xiao Feng, Sanmi Koyejo, Jian Tang, Bo Han
cs.AI
Zusammenfassung
Zahlreiche Anwendungen großer Sprachmodelle (LLMs) basieren auf ihrer Fähigkeit, schrittweise Schlussfolgerungen zu ziehen. Das Schlussfolgerungsverhalten von LLMs bleibt jedoch weitgehend unverstanden, was Herausforderungen für Forschung, Entwicklung und Sicherheit darstellt. Um diese Lücke zu schließen, führen wir die "Landscape of Thoughts" ein – das erste Visualisierungswerkzeug, mit dem Benutzer die Argumentationspfade von Chain-of-Thought und seinen Derivaten in jedem Multiple-Choice-Datensatz untersuchen können. Konkret repräsentieren wir die Zustände in einem Argumentationspfad als Feature-Vektoren, die ihre Abstände zu allen Antwortmöglichkeiten quantifizieren. Diese Merkmale werden dann mithilfe von t-SNE in zweidimensionalen Diagrammen visualisiert. Qualitative und quantitative Analysen mit der "Landscape of Thoughts" unterscheiden effektiv zwischen starken und schwachen Modellen, richtigen und falschen Antworten sowie verschiedenen Argumentationsaufgaben. Sie decken auch unerwünschte Argumentationsmuster auf, wie geringe Konsistenz und hohe Unsicherheit. Darüber hinaus können Benutzer unser Werkzeug an ein Modell anpassen, das die von ihnen beobachtete Eigenschaft vorhersagt. Wir demonstrieren diesen Vorteil, indem wir unser Werkzeug an einen leichten Verifizierer anpassen, der die Korrektheit von Argumentationspfaden bewertet. Der Code ist öffentlich verfügbar unter: https://github.com/tmlr-group/landscape-of-thoughts.
English
Numerous applications of large language models (LLMs) rely on their ability
to perform step-by-step reasoning. However, the reasoning behavior of LLMs
remains poorly understood, posing challenges to research, development, and
safety. To address this gap, we introduce landscape of thoughts-the first
visualization tool for users to inspect the reasoning paths of chain-of-thought
and its derivatives on any multi-choice dataset. Specifically, we represent the
states in a reasoning path as feature vectors that quantify their distances to
all answer choices. These features are then visualized in two-dimensional plots
using t-SNE. Qualitative and quantitative analysis with the landscape of
thoughts effectively distinguishes between strong and weak models, correct and
incorrect answers, as well as different reasoning tasks. It also uncovers
undesirable reasoning patterns, such as low consistency and high uncertainty.
Additionally, users can adapt our tool to a model that predicts the property
they observe. We showcase this advantage by adapting our tool to a lightweight
verifier that evaluates the correctness of reasoning paths. The code is
publicly available at: https://github.com/tmlr-group/landscape-of-thoughts.Summary
AI-Generated Summary