Panorama de Pensamentos: Visualizando o Processo de Raciocínio dos Modelos de Linguagem de Grande Escala
Landscape of Thoughts: Visualizing the Reasoning Process of Large Language Models
March 28, 2025
Autores: Zhanke Zhou, Zhaocheng Zhu, Xuan Li, Mikhail Galkin, Xiao Feng, Sanmi Koyejo, Jian Tang, Bo Han
cs.AI
Resumo
Numerosas aplicações de modelos de linguagem de grande escala (LLMs) dependem de sua capacidade de realizar raciocínio passo a passo. No entanto, o comportamento de raciocínio dos LLMs ainda é pouco compreendido, o que representa desafios para pesquisa, desenvolvimento e segurança. Para abordar essa lacuna, introduzimos o "landscape of thoughts" - a primeira ferramenta de visualização que permite aos usuários inspecionar os caminhos de raciocínio de cadeias de pensamento e suas derivadas em qualquer conjunto de dados de múltipla escolha. Especificamente, representamos os estados em um caminho de raciocínio como vetores de características que quantificam suas distâncias em relação a todas as opções de resposta. Essas características são então visualizadas em gráficos bidimensionais usando t-SNE. A análise qualitativa e quantitativa com o "landscape of thoughts" distingue efetivamente entre modelos fortes e fracos, respostas corretas e incorretas, bem como diferentes tarefas de raciocínio. Ele também revela padrões indesejáveis de raciocínio, como baixa consistência e alta incerteza. Além disso, os usuários podem adaptar nossa ferramenta a um modelo que prevê a propriedade que eles observam. Demonstramos essa vantagem ao adaptar nossa ferramenta a um verificador leve que avalia a correção dos caminhos de raciocínio. O código está publicamente disponível em: https://github.com/tmlr-group/landscape-of-thoughts.
English
Numerous applications of large language models (LLMs) rely on their ability
to perform step-by-step reasoning. However, the reasoning behavior of LLMs
remains poorly understood, posing challenges to research, development, and
safety. To address this gap, we introduce landscape of thoughts-the first
visualization tool for users to inspect the reasoning paths of chain-of-thought
and its derivatives on any multi-choice dataset. Specifically, we represent the
states in a reasoning path as feature vectors that quantify their distances to
all answer choices. These features are then visualized in two-dimensional plots
using t-SNE. Qualitative and quantitative analysis with the landscape of
thoughts effectively distinguishes between strong and weak models, correct and
incorrect answers, as well as different reasoning tasks. It also uncovers
undesirable reasoning patterns, such as low consistency and high uncertainty.
Additionally, users can adapt our tool to a model that predicts the property
they observe. We showcase this advantage by adapting our tool to a lightweight
verifier that evaluates the correctness of reasoning paths. The code is
publicly available at: https://github.com/tmlr-group/landscape-of-thoughts.Summary
AI-Generated Summary