ChatPaper.aiChatPaper

RAG Rentable para la Coincidencia de Entidades con LLM: Una Exploración Basada en Bloqueo

Cost-Efficient RAG for Entity Matching with LLMs: A Blocking-based Exploration

February 5, 2026
Autores: Chuangtao Ma, Zeyu Zhang, Arijit Khan, Sebastian Schelter, Paul Groth
cs.AI

Resumen

La generación aumentada por recuperación (RAG) mejora el razonamiento de los LLM en tareas intensivas en conocimiento, pero los flujos de trabajo de RAG existentes conllevan una sobrecarga sustancial de recuperación y generación cuando se aplican a la concordancia de entidades a gran escala. Para abordar esta limitación, presentamos CE-RAG4EM, una arquitectura RAG de bajo costo que reduce la computación mediante la recuperación y generación por lotes basada en bloqueo. También presentamos un marco unificado para analizar y evaluar sistemas RAG para concordancia de entidades, centrándonos en optimizaciones conscientes del bloqueo y en la granularidad de la recuperación. Experimentos exhaustivos sugieren que CE-RAG4EM puede lograr una calidad de concordancia comparable o mejorada mientras reduce sustancialmente el tiempo de ejecución de extremo a extremo en comparación con líneas de base sólidas. Nuestro análisis revela además que los parámetros clave de configuración introducen una compensación inherente entre el rendimiento y la sobrecarga, ofreciendo una guía práctica para diseñar sistemas RAG eficientes y escalables para la concordancia de entidades y la integración de datos.
English
Retrieval-augmented generation (RAG) enhances LLM reasoning in knowledge-intensive tasks, but existing RAG pipelines incur substantial retrieval and generation overhead when applied to large-scale entity matching. To address this limitation, we introduce CE-RAG4EM, a cost-efficient RAG architecture that reduces computation through blocking-based batch retrieval and generation. We also present a unified framework for analyzing and evaluating RAG systems for entity matching, focusing on blocking-aware optimizations and retrieval granularity. Extensive experiments suggest that CE-RAG4EM can achieve comparable or improved matching quality while substantially reducing end-to-end runtime relative to strong baselines. Our analysis further reveals that key configuration parameters introduce an inherent trade-off between performance and overhead, offering practical guidance for designing efficient and scalable RAG systems for entity matching and data integration.
PDF12February 11, 2026