Verso un'Elaborazione Affidabile per la Generazione Potenziata da Recupero per Modelli Linguistici di Grandi Dimensioni: Un'Indagine
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
February 8, 2025
Autori: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
cs.AI
Abstract
Il Generazione con Recupero (RAG) è una tecnica avanzata progettata per affrontare le sfide del Contenuto Generato dall'Intelligenza Artificiale (AIGC). Integrando il recupero del contesto nella generazione di contenuti, il RAG fornisce conoscenze esterne affidabili e aggiornate, riduce le allucinazioni e garantisce un contesto rilevante in una vasta gamma di compiti. Tuttavia, nonostante il successo e il potenziale del RAG, studi recenti hanno dimostrato che il paradigma del RAG introduce anche nuovi rischi, tra cui problemi di robustezza, preoccupazioni sulla privacy, attacchi avversari e questioni di responsabilità. Affrontare questi rischi è fondamentale per le future applicazioni dei sistemi RAG, poiché influenzano direttamente la loro affidabilità. Sebbene siano stati sviluppati vari metodi per migliorare l'affidabilità dei metodi RAG, manca una prospettiva unificata e un quadro di riferimento per la ricerca su questo argomento. Pertanto, in questo articolo, miriamo a colmare questa lacuna fornendo una roadmap completa per lo sviluppo di sistemi RAG affidabili. Strutturiamo la nostra discussione attorno a cinque prospettive chiave: affidabilità, privacy, sicurezza, equità, spiegabilità e responsabilità. Per ciascuna prospettiva, presentiamo un quadro generale e una tassonomia, offrendo un approccio strutturato per comprendere le sfide attuali, valutare le soluzioni esistenti e individuare promettenti direzioni future di ricerca. Per incoraggiare una più ampia adozione e innovazione, mettiamo in evidenza anche le applicazioni derivate in cui i sistemi RAG affidabili hanno un impatto significativo.
English
Retrieval-Augmented Generation (RAG) is an advanced technique designed to
address the challenges of Artificial Intelligence-Generated Content (AIGC). By
integrating context retrieval into content generation, RAG provides reliable
and up-to-date external knowledge, reduces hallucinations, and ensures relevant
context across a wide range of tasks. However, despite RAG's success and
potential, recent studies have shown that the RAG paradigm also introduces new
risks, including robustness issues, privacy concerns, adversarial attacks, and
accountability issues. Addressing these risks is critical for future
applications of RAG systems, as they directly impact their trustworthiness.
Although various methods have been developed to improve the trustworthiness of
RAG methods, there is a lack of a unified perspective and framework for
research in this topic. Thus, in this paper, we aim to address this gap by
providing a comprehensive roadmap for developing trustworthy RAG systems. We
place our discussion around five key perspectives: reliability, privacy,
safety, fairness, explainability, and accountability. For each perspective, we
present a general framework and taxonomy, offering a structured approach to
understanding the current challenges, evaluating existing solutions, and
identifying promising future research directions. To encourage broader adoption
and innovation, we also highlight the downstream applications where trustworthy
RAG systems have a significant impact.Summary
AI-Generated Summary