Auf dem Weg zu vertrauenswürdiger Abruf-erweiterter Generierung für große Sprachmodelle: Eine Übersicht
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
February 8, 2025
Autoren: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
cs.AI
Zusammenfassung
Die Retrieval-Augmented Generation (RAG) ist eine fortschrittliche Technik, die entwickelt wurde, um den Herausforderungen von KI-generierten Inhalten (AIGC) zu begegnen. Durch die Integration von Kontextabruf in die Inhaltegenerierung bietet RAG zuverlässiges und aktuelles externes Wissen, reduziert Halluzinationen und gewährleistet relevanten Kontext über eine Vielzahl von Aufgaben hinweg. Trotz des Erfolgs und Potenzials von RAG haben jüngste Studien gezeigt, dass das RAG-Paradigma auch neue Risiken mit sich bringt, darunter Robustheitsprobleme, Datenschutzbedenken, adversarielle Angriffe und Verantwortlichkeitsfragen. Die Bewältigung dieser Risiken ist entscheidend für zukünftige Anwendungen von RAG-Systemen, da sie direkt deren Vertrauenswürdigkeit beeinflussen. Obwohl verschiedene Methoden entwickelt wurden, um die Vertrauenswürdigkeit von RAG-Methoden zu verbessern, fehlt es an einer einheitlichen Perspektive und einem Rahmen für die Forschung zu diesem Thema. Daher zielen wir in diesem Artikel darauf ab, diese Lücke zu schließen, indem wir einen umfassenden Fahrplan für die Entwicklung vertrauenswürdiger RAG-Systeme bereitstellen. Wir strukturieren unsere Diskussion um fünf Schlüsselperspektiven: Zuverlässigkeit, Datenschutz, Sicherheit, Fairness, Erklärbarkeit und Verantwortlichkeit. Für jede Perspektive präsentieren wir einen allgemeinen Rahmen und eine Taxonomie, die einen strukturierten Ansatz zur Erfassung der aktuellen Herausforderungen, zur Bewertung bestehender Lösungen und zur Identifizierung vielversprechender zukünftiger Forschungsrichtungen bieten. Um eine breitere Akzeptanz und Innovation zu fördern, heben wir auch die nachgelagerten Anwendungen hervor, in denen vertrauenswürdige RAG-Systeme einen signifikanten Einfluss haben.
English
Retrieval-Augmented Generation (RAG) is an advanced technique designed to
address the challenges of Artificial Intelligence-Generated Content (AIGC). By
integrating context retrieval into content generation, RAG provides reliable
and up-to-date external knowledge, reduces hallucinations, and ensures relevant
context across a wide range of tasks. However, despite RAG's success and
potential, recent studies have shown that the RAG paradigm also introduces new
risks, including robustness issues, privacy concerns, adversarial attacks, and
accountability issues. Addressing these risks is critical for future
applications of RAG systems, as they directly impact their trustworthiness.
Although various methods have been developed to improve the trustworthiness of
RAG methods, there is a lack of a unified perspective and framework for
research in this topic. Thus, in this paper, we aim to address this gap by
providing a comprehensive roadmap for developing trustworthy RAG systems. We
place our discussion around five key perspectives: reliability, privacy,
safety, fairness, explainability, and accountability. For each perspective, we
present a general framework and taxonomy, offering a structured approach to
understanding the current challenges, evaluating existing solutions, and
identifying promising future research directions. To encourage broader adoption
and innovation, we also highlight the downstream applications where trustworthy
RAG systems have a significant impact.Summary
AI-Generated Summary