Paisaje de Pensamientos: Visualizando el Proceso de Razonamiento de los Modelos de Lenguaje a Gran Escala
Landscape of Thoughts: Visualizing the Reasoning Process of Large Language Models
March 28, 2025
Autores: Zhanke Zhou, Zhaocheng Zhu, Xuan Li, Mikhail Galkin, Xiao Feng, Sanmi Koyejo, Jian Tang, Bo Han
cs.AI
Resumen
Numerosas aplicaciones de los grandes modelos de lenguaje (LLMs) dependen de su capacidad para realizar razonamientos paso a paso. Sin embargo, el comportamiento de razonamiento de los LLMs sigue siendo poco comprendido, lo que plantea desafíos para la investigación, el desarrollo y la seguridad. Para abordar esta brecha, presentamos "landscape of thoughts", la primera herramienta de visualización que permite a los usuarios inspeccionar las rutas de razonamiento de la cadena de pensamiento y sus derivados en cualquier conjunto de datos de opción múltiple. Específicamente, representamos los estados en una ruta de razonamiento como vectores de características que cuantifican sus distancias a todas las opciones de respuesta. Estas características se visualizan luego en gráficos bidimensionales utilizando t-SNE. El análisis cualitativo y cuantitativo con "landscape of thoughts" distingue eficazmente entre modelos fuertes y débiles, respuestas correctas e incorrectas, así como diferentes tareas de razonamiento. También revela patrones de razonamiento indeseables, como baja consistencia y alta incertidumbre. Además, los usuarios pueden adaptar nuestra herramienta a un modelo que prediga la propiedad que observan. Mostramos esta ventaja adaptando nuestra herramienta a un verificador ligero que evalúa la corrección de las rutas de razonamiento. El código está disponible públicamente en: https://github.com/tmlr-group/landscape-of-thoughts.
English
Numerous applications of large language models (LLMs) rely on their ability
to perform step-by-step reasoning. However, the reasoning behavior of LLMs
remains poorly understood, posing challenges to research, development, and
safety. To address this gap, we introduce landscape of thoughts-the first
visualization tool for users to inspect the reasoning paths of chain-of-thought
and its derivatives on any multi-choice dataset. Specifically, we represent the
states in a reasoning path as feature vectors that quantify their distances to
all answer choices. These features are then visualized in two-dimensional plots
using t-SNE. Qualitative and quantitative analysis with the landscape of
thoughts effectively distinguishes between strong and weak models, correct and
incorrect answers, as well as different reasoning tasks. It also uncovers
undesirable reasoning patterns, such as low consistency and high uncertainty.
Additionally, users can adapt our tool to a model that predicts the property
they observe. We showcase this advantage by adapting our tool to a lightweight
verifier that evaluates the correctness of reasoning paths. The code is
publicly available at: https://github.com/tmlr-group/landscape-of-thoughts.Summary
AI-Generated Summary