Vers une génération augmentée de récupération fiable pour les grands modèles de langage : une enquête
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
February 8, 2025
Auteurs: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
cs.AI
Résumé
La Génération Améliorée par Récupération (GAR) est une technique avancée conçue pour relever les défis du Contenu Généré par l'Intelligence Artificielle (CGIA). En intégrant la récupération de contexte dans la génération de contenu, la GAR fournit des connaissances externes fiables et à jour, réduit les hallucinations et garantit un contexte pertinent pour un large éventail de tâches. Cependant, malgré le succès et le potentiel de la GAR, des études récentes ont montré que le paradigme de la GAR introduit également de nouveaux risques, notamment des problèmes de robustesse, des préoccupations en matière de confidentialité, des attaques adverses et des problèmes de responsabilité. Il est essentiel de traiter ces risques pour les futures applications des systèmes GAR, car ils impactent directement leur fiabilité. Bien que diverses méthodes aient été développées pour améliorer la fiabilité des méthodes GAR, il manque une perspective unifiée et un cadre de recherche dans ce domaine. Ainsi, dans cet article, nous visons à combler cette lacune en fournissant une feuille de route complète pour le développement de systèmes GAR fiables. Nous structurons notre discussion autour de cinq perspectives clés : la fiabilité, la confidentialité, la sécurité, l'équité, l'explicabilité et la responsabilité. Pour chaque perspective, nous présentons un cadre général et une taxonomie, offrant une approche structurée pour comprendre les défis actuels, évaluer les solutions existantes et identifier des orientations prometteuses pour la recherche future. Pour encourager une adoption plus large et l'innovation, nous mettons également en lumière les applications aval où les systèmes GAR fiables ont un impact significatif.
English
Retrieval-Augmented Generation (RAG) is an advanced technique designed to
address the challenges of Artificial Intelligence-Generated Content (AIGC). By
integrating context retrieval into content generation, RAG provides reliable
and up-to-date external knowledge, reduces hallucinations, and ensures relevant
context across a wide range of tasks. However, despite RAG's success and
potential, recent studies have shown that the RAG paradigm also introduces new
risks, including robustness issues, privacy concerns, adversarial attacks, and
accountability issues. Addressing these risks is critical for future
applications of RAG systems, as they directly impact their trustworthiness.
Although various methods have been developed to improve the trustworthiness of
RAG methods, there is a lack of a unified perspective and framework for
research in this topic. Thus, in this paper, we aim to address this gap by
providing a comprehensive roadmap for developing trustworthy RAG systems. We
place our discussion around five key perspectives: reliability, privacy,
safety, fairness, explainability, and accountability. For each perspective, we
present a general framework and taxonomy, offering a structured approach to
understanding the current challenges, evaluating existing solutions, and
identifying promising future research directions. To encourage broader adoption
and innovation, we also highlight the downstream applications where trustworthy
RAG systems have a significant impact.Summary
AI-Generated Summary