OLMoTrace : Retracer les sorties des modèles de langage jusqu'aux billions de tokens d'entraînementOLMoTrace: Tracing Language Model Outputs Back to Trillions of Training
Tokens
Nous présentons OLMoTrace, le premier système capable de retracer en temps réel les sorties des modèles de langage jusqu'à leurs données d'entraînement complètes, composées de plusieurs milliers de milliards de tokens. OLMoTrace identifie et affiche les correspondances textuelles exactes entre des segments de sortie des modèles de langage et des documents issus des corpus de textes d'entraînement. Propulsé par une version étendue d'infini-gram (Liu et al., 2024), notre système renvoie les résultats de traçage en quelques secondes. OLMoTrace permet aux utilisateurs de mieux comprendre le comportement des modèles de langage à travers le prisme de leurs données d'entraînement. Nous démontrons comment il peut être utilisé pour explorer la vérification des faits, les hallucinations et la créativité des modèles de langage. OLMoTrace est accessible au public et entièrement open-source.