RAG Économique pour l'Appariement d'Entités avec les LLM : Une Exploration Basée sur le Pré-filtrage

papers.abstract

La génération augmentée par récupération (RAG) améliore le raisonnement des grands modèles de langage dans les tâches nécessitant une connaissance approfondie, mais les pipelines RAG existants entraînent des surcoûts substantiels de récupération et de génération lorsqu'ils sont appliqués à l'appariement d'entités à grande échelle. Pour remédier à cette limitation, nous présentons CE-RAG4EM, une architecture RAG à coût réduit qui diminue la charge computationnelle via une récupération et une génération par lots basées sur le préfiltrage (blocking). Nous proposons également un cadre unifié pour analyser et évaluer les systèmes RAG pour l'appariement d'entités, en nous concentrant sur les optimisations tenant compte du préfiltrage et la granularité de la récupération. Des expérimentations approfondies indiquent que CE-RAG4EM peut atteindre une qualité d'appariement comparable ou supérieure tout en réduisant substantiellement le temps d'exécution end-to-end par rapport à des bases de référence solides. Notre analyse révèle en outre que les paramètres de configuration clés introduisent un compromis inhérent entre performance et surcoût, offrant ainsi des orientations pratiques pour concevoir des systèmes RAG efficaces et évolutifs pour l'appariement d'entités et l'intégration de données.

English

Retrieval-augmented generation (RAG) enhances LLM reasoning in knowledge-intensive tasks, but existing RAG pipelines incur substantial retrieval and generation overhead when applied to large-scale entity matching. To address this limitation, we introduce CE-RAG4EM, a cost-efficient RAG architecture that reduces computation through blocking-based batch retrieval and generation. We also present a unified framework for analyzing and evaluating RAG systems for entity matching, focusing on blocking-aware optimizations and retrieval granularity. Extensive experiments suggest that CE-RAG4EM can achieve comparable or improved matching quality while substantially reducing end-to-end runtime relative to strong baselines. Our analysis further reveals that key configuration parameters introduce an inherent trade-off between performance and overhead, offering practical guidance for designing efficient and scalable RAG systems for entity matching and data integration.

RAG Économique pour l'Appariement d'Entités avec les LLM : Une Exploration Basée sur le Pré-filtrage

Cost-Efficient RAG for Entity Matching with LLMs: A Blocking-based Exploration

papers.abstract

Support