Récupération personnalisée basée sur les graphes pour les grands modèles de langage
Personalized Graph-Based Retrieval for Large Language Models
January 4, 2025
Auteurs: Steven Au, Cameron J. Dimacali, Ojasmitha Pedirappagari, Namyong Park, Franck Dernoncourt, Yu Wang, Nikos Kanakaris, Hanieh Deilamsalehy, Ryan A. Rossi, Nesreen K. Ahmed
cs.AI
Résumé
À mesure que les grands modèles de langage (GML) évoluent, leur capacité à fournir des réponses personnalisées et contextuelles offre un potentiel transformateur pour améliorer les expériences utilisateur. Cependant, les approches de personnalisation existantes se basent souvent uniquement sur l'historique de l'utilisateur pour enrichir la requête, limitant leur efficacité dans la génération de sorties adaptées, notamment dans des scénarios de démarrage à froid avec des données clairsemées. Pour remédier à ces limitations, nous proposons Retrieval-Augmented Generation basée sur un graphe personnalisé (PGraphRAG), un cadre qui exploite les graphes de connaissances centrés sur l'utilisateur pour enrichir la personnalisation. En intégrant directement les connaissances structurées de l'utilisateur dans le processus de recherche et en augmentant les requêtes avec un contexte pertinent pour l'utilisateur, PGraphRAG améliore la compréhension contextuelle et la qualité des sorties. Nous introduisons également le Benchmark basé sur un graphe personnalisé pour la génération de texte, conçu pour évaluer les tâches de génération de texte personnalisé dans des environnements réels où l'historique de l'utilisateur est clairsemé ou non disponible. Les résultats expérimentaux montrent que PGraphRAG surpasse significativement les méthodes de personnalisation de pointe sur diverses tâches, démontrant les avantages uniques de la recherche basée sur un graphe pour la personnalisation.
English
As large language models (LLMs) evolve, their ability to deliver personalized
and context-aware responses offers transformative potential for improving user
experiences. Existing personalization approaches, however, often rely solely on
user history to augment the prompt, limiting their effectiveness in generating
tailored outputs, especially in cold-start scenarios with sparse data. To
address these limitations, we propose Personalized Graph-based
Retrieval-Augmented Generation (PGraphRAG), a framework that leverages
user-centric knowledge graphs to enrich personalization. By directly
integrating structured user knowledge into the retrieval process and augmenting
prompts with user-relevant context, PGraphRAG enhances contextual understanding
and output quality. We also introduce the Personalized Graph-based Benchmark
for Text Generation, designed to evaluate personalized text generation tasks in
real-world settings where user history is sparse or unavailable. Experimental
results show that PGraphRAG significantly outperforms state-of-the-art
personalization methods across diverse tasks, demonstrating the unique
advantages of graph-based retrieval for personalization.Summary
AI-Generated Summary