ChatPaper.aiChatPaper

E^2Rank: Ihr Text-Embedding kann auch ein effektiver und effizienter listenweiser Reranker sein

E^2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

October 26, 2025
papers.authors: Qi Liu, Yanzhao Zhang, Mingxin Li, Dingkun Long, Pengjun Xie, Jiaxin Mao
cs.AI

papers.abstract

Text-Embedding-Modelle stellen eine grundlegende Komponente in realen Suchanwendungen dar. Durch die Abbildung von Anfragen und Dokumenten in einen gemeinsamen Embedding-Raum liefern sie wettbewerbsfähige Retrieval-Leistung bei hoher Effizienz. Ihre Ranking-Genauigkeit bleibt jedoch im Vergleich zu spezialisierten Rerankern, insbesondere neueren listenbasierten LLM-Rerankern, die feinkörnige Anfrage-Dokument- und Dokument-Dokument-Interaktionen erfassen, begrenzt. In diesem Artikel schlagen wir ein einfaches, aber effektives einheitliches Framework namens E^2Rank vor (steht für Efficient Embedding-based Ranking bzw. Embedding-to-Rank), das ein einzelnes Text-Embedding-Modell erweitert, um sowohl hochwertiges Retrieval als auch listenbasiertes Reranking durch weiterführendes Training unter einem listenbasierten Ranking-Ziel durchzuführen, wodurch starke Effektivität bei bemerkenswerter Effizienz erreicht wird. Indem die Kosinus-Ähnlichkeit zwischen den Anfrage- und Dokument-Embeddings als einheitliche Ranking-Funktion verwendet wird, dient der listenbasierte Ranking-Prompt, der aus der ursprünglichen Anfrage und ihren Kandidatendokumenten konstruiert wird, als eine verbesserte Anfrage, die mit Signalen aus den Top-K-Dokumenten angereichert ist, ähnlich dem Pseudo-Relevance-Feedback (PRF) in traditionellen Retrieval-Modellen. Dieses Design erhält die Effizienz und Repräsentationsqualität des Basis-Embedding-Modells bei gleichzeitiger signifikanter Verbesserung seiner Reranking-Leistung. Empirisch erzielt E^2Rank state-of-the-art Ergebnisse auf dem BEIR-Reranking-Benchmark und zeigt wettbewerbsfähige Leistung auf dem reasoning-intensiven BRIGHT-Benchmark bei sehr geringer Reranking-Latenz. Wir zeigen auch, dass der Ranking-Trainingsprozess die Embedding-Leistung auf dem MTEB-Benchmark verbessert. Unsere Ergebnisse deuten darauf hin, dass ein einzelnes Embedding-Modell Retrieval und Reranking effektiv vereinheitlichen kann und sowohl Recheneffizienz als auch wettbewerbsfähige Ranking-Genauigkeit bietet.
English
Text embedding models serve as a fundamental component in real-world search applications. By mapping queries and documents into a shared embedding space, they deliver competitive retrieval performance with high efficiency. However, their ranking fidelity remains limited compared to dedicated rerankers, especially recent LLM-based listwise rerankers, which capture fine-grained query-document and document-document interactions. In this paper, we propose a simple yet effective unified framework E^2Rank, means Efficient Embedding-based Ranking (also means Embedding-to-Rank), which extends a single text embedding model to perform both high-quality retrieval and listwise reranking through continued training under a listwise ranking objective, thereby achieving strong effectiveness with remarkable efficiency. By applying cosine similarity between the query and document embeddings as a unified ranking function, the listwise ranking prompt, which is constructed from the original query and its candidate documents, serves as an enhanced query enriched with signals from the top-K documents, akin to pseudo-relevance feedback (PRF) in traditional retrieval models. This design preserves the efficiency and representational quality of the base embedding model while significantly improving its reranking performance. Empirically, E^2Rank achieves state-of-the-art results on the BEIR reranking benchmark and demonstrates competitive performance on the reasoning-intensive BRIGHT benchmark, with very low reranking latency. We also show that the ranking training process improves embedding performance on the MTEB benchmark. Our findings indicate that a single embedding model can effectively unify retrieval and reranking, offering both computational efficiency and competitive ranking accuracy.
PDF311December 31, 2025