ChatPaper.aiChatPaper

OLMoTrace: Отслеживание выходных данных языковых моделей до триллионов обучающих токенов

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

April 9, 2025
Авторы: Jiacheng Liu, Taylor Blanton, Yanai Elazar, Sewon Min, YenSung Chen, Arnavi Chheda-Kothary, Huy Tran, Byron Bischoff, Eric Marsh, Michael Schmitz, Cassidy Trier, Aaron Sarnat, Jenna James, Jon Borchardt, Bailey Kuehl, Evie Cheng, Karen Farley, Sruthi Sreeram, Taira Anderson, David Albright, Carissa Schoenick, Luca Soldaini, Dirk Groeneveld, Rock Yuren Pang, Pang Wei Koh, Noah A. Smith, Sophie Lebrecht, Yejin Choi, Hannaneh Hajishirzi, Ali Farhadi, Jesse Dodge
cs.AI

Аннотация

Мы представляем OLMoTrace — первую систему, которая в режиме реального времени отслеживает выходные данные языковых моделей до их полных обучающих данных объемом в несколько триллионов токенов. OLMoTrace находит и отображает дословные совпадения между фрагментами выходных данных языковой модели и документами в обучающих текстовых корпусах. Благодаря расширенной версии infini-gram (Liu et al., 2024), наша система возвращает результаты трассировки за несколько секунд. OLMoTrace помогает пользователям понять поведение языковых моделей через призму их обучающих данных. Мы демонстрируем, как её можно использовать для исследования проверки фактов, галлюцинаций и креативности языковых моделей. OLMoTrace доступна публично и полностью открыта для использования.
English
We present OLMoTrace, the first system that traces the outputs of language models back to their full, multi-trillion-token training data in real time. OLMoTrace finds and shows verbatim matches between segments of language model output and documents in the training text corpora. Powered by an extended version of infini-gram (Liu et al., 2024), our system returns tracing results within a few seconds. OLMoTrace can help users understand the behavior of language models through the lens of their training data. We showcase how it can be used to explore fact checking, hallucination, and the creativity of language models. OLMoTrace is publicly available and fully open-source.

Summary

AI-Generated Summary

PDF733April 10, 2025