К Надежному Поиску с Расширенной Генерацией для Больших Языковых Моделей: Обзор
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
February 8, 2025
Авторы: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
cs.AI
Аннотация
Расширенная генерация с использованием поиска (RAG) - это передовая техника, разработанная для решения проблем, связанных с созданием контента искусственным интеллектом (AIGC). Интегрируя поиск контекста в генерацию контента, RAG обеспечивает надежные и актуальные внешние знания, снижает галлюцинации и обеспечивает соответствующий контекст в широком спектре задач. Однако, несмотря на успех и потенциал RAG, недавние исследования показали, что парадигма RAG также вносит новые риски, включая проблемы устойчивости, вопросы конфиденциальности, атаки злоумышленников и проблемы ответственности. Решение этих рисков критично для будущих приложений систем RAG, поскольку они напрямую влияют на их надежность. Хотя были разработаны различные методы для улучшения надежности методов RAG, отсутствует единая перспектива и рамка для исследований в этой области. Таким образом, в данной статье мы стремимся заполнить этот пробел, предоставив всестороннюю дорожную карту для разработки надежных систем RAG. Мы строим наше обсуждение вокруг пяти ключевых перспектив: надежность, конфиденциальность, безопасность, справедливость, объяснимость и ответственность. Для каждой перспективы мы представляем общую структуру и таксономию, предлагая структурированный подход к пониманию текущих проблем, оценке существующих решений и выявлению перспективных направлений будущих исследований. Для поощрения более широкого принятия и инноваций мы также выделяем прикладные области, где надежные системы RAG имеют значительное влияние.
English
Retrieval-Augmented Generation (RAG) is an advanced technique designed to
address the challenges of Artificial Intelligence-Generated Content (AIGC). By
integrating context retrieval into content generation, RAG provides reliable
and up-to-date external knowledge, reduces hallucinations, and ensures relevant
context across a wide range of tasks. However, despite RAG's success and
potential, recent studies have shown that the RAG paradigm also introduces new
risks, including robustness issues, privacy concerns, adversarial attacks, and
accountability issues. Addressing these risks is critical for future
applications of RAG systems, as they directly impact their trustworthiness.
Although various methods have been developed to improve the trustworthiness of
RAG methods, there is a lack of a unified perspective and framework for
research in this topic. Thus, in this paper, we aim to address this gap by
providing a comprehensive roadmap for developing trustworthy RAG systems. We
place our discussion around five key perspectives: reliability, privacy,
safety, fairness, explainability, and accountability. For each perspective, we
present a general framework and taxonomy, offering a structured approach to
understanding the current challenges, evaluating existing solutions, and
identifying promising future research directions. To encourage broader adoption
and innovation, we also highlight the downstream applications where trustworthy
RAG systems have a significant impact.Summary
AI-Generated Summary