MCompassRAG: Metadatos de temas como brújula semántica para la recuperación a nivel de párrafo

Resumen

Los sistemas de generación aumentada por recuperación (RAG) dependen críticamente de cómo se fragmentan y buscan los documentos. Los fragmentos de granularidad fina pueden mejorar la precisión de la recuperación, pero amplían el espacio de búsqueda, aumentando la latencia y el coste; los fragmentos más grandes reducen el número de candidatos, pero hacen que la similitud densa sea menos fiable, ya que la representación de cada fragmento mezcla múltiples temas e introduce más ruido semántico. Esta disyuntiva se vuelve especialmente limitante en tareas de investigación profunda, donde la recuperación debe ser rápida y precisa en corpus grandes y heterogéneos. Presentamos MCompassRAG, un marco de recuperación guiado por metadatos que utiliza señales a nivel de tema como una brújula semántica para seleccionar evidencia relevante. En lugar de depender únicamente de la similitud coseno entre consultas y representaciones de fragmentos ruidosas, MCompassRAG enriquece las representaciones de los fragmentos con metadatos de tema en el mismo espacio de incrustación y entrena un recuperador ligero mediante destilación de profesor-LLM. En tiempo de inferencia, MCompassRAG realiza una recuperación consciente del tema sin necesidad de llamadas adicionales al LLM, mejorando tanto la eficiencia como la calidad de la evidencia. En seis puntos de referencia complejos de recuperación, MCompassRAG mejora la eficiencia de la información (IE) en un 8,24% de media, con una latencia más de 5 veces inferior a la de los modelos de referencia RAG eficientes más potentes. El código está disponible en https://github.com/AmirAbaskohi/MCompassRAG.

English

Retrieval-augmented generation (RAG) systems depend critically on how documents are chunked and searched. Fine-grained chunks can improve retrieval precision but expand the search space, increasing latency and cost; larger chunks reduce the number of candidates but make dense similarity less reliable, as the representation for each chunk mixes multiple topics and introduces more semantic noise. This trade-off becomes especially limiting in deep research tasks, where retrieval must be both fast and precise across large, heterogeneous corpora. We introduce MCompassRAG, a metadata-guided retrieval framework that uses topic-level signals as a semantic compass for selecting relevant evidence. Instead of relying only on cosine similarity between queries and noisy chunk embeddings, MCompassRAG enriches chunk representations with topic metadata in the same embedding space and trains a lightweight retriever through LLM-teacher distillation. At inference time, MCompassRAG performs topic-aware retrieval without additional LLM calls, improving both efficiency and evidence quality. Across six complex retrieval benchmarks, MCompassRAG improves information efficiency (IE) by 8.24% on average with over 5 times lower latency than the strongest efficient RAG baselines. Code is available on https://github.com/AmirAbaskohi/MCompassRAG.