OLMoTrace: Rastreando Saídas de Modelos de Linguagem até Trilhões de Tokens de Treinamento

Resumo

Apresentamos o OLMoTrace, o primeiro sistema que rastreia as saídas de modelos de linguagem de volta aos seus dados de treinamento completos, compostos por múltiplos trilhões de tokens, em tempo real. O OLMoTrace identifica e exibe correspondências textuais entre segmentos das saídas do modelo de linguagem e documentos nos corpora de texto de treinamento. Impulsionado por uma versão estendida do infini-gram (Liu et al., 2024), nosso sistema retorna os resultados de rastreamento em poucos segundos. O OLMoTrace pode ajudar os usuários a compreender o comportamento dos modelos de linguagem através da lente de seus dados de treinamento. Demonstramos como ele pode ser usado para explorar a verificação de fatos, alucinações e a criatividade dos modelos de linguagem. O OLMoTrace está publicamente disponível e é totalmente de código aberto.

English

We present OLMoTrace, the first system that traces the outputs of language models back to their full, multi-trillion-token training data in real time. OLMoTrace finds and shows verbatim matches between segments of language model output and documents in the training text corpora. Powered by an extended version of infini-gram (Liu et al., 2024), our system returns tracing results within a few seconds. OLMoTrace can help users understand the behavior of language models through the lens of their training data. We showcase how it can be used to explore fact checking, hallucination, and the creativity of language models. OLMoTrace is publicly available and fully open-source.

OLMoTrace: Rastreando Saídas de Modelos de Linguagem até Trilhões de Tokens de Treinamento

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

Resumo

Support