OLMoTrace: Отслеживание выходных данных языковых моделей до триллионов обучающих токеновOLMoTrace: Tracing Language Model Outputs Back to Trillions of Training
Tokens
Мы представляем OLMoTrace — первую систему, которая в режиме реального времени отслеживает выходные данные языковых моделей до их полных обучающих данных объемом в несколько триллионов токенов. OLMoTrace находит и отображает дословные совпадения между фрагментами выходных данных языковой модели и документами в обучающих текстовых корпусах. Благодаря расширенной версии infini-gram (Liu et al., 2024), наша система возвращает результаты трассировки за несколько секунд. OLMoTrace помогает пользователям понять поведение языковых моделей через призму их обучающих данных. Мы демонстрируем, как её можно использовать для исследования проверки фактов, галлюцинаций и креативности языковых моделей. OLMoTrace доступна публично и полностью открыта для использования.