E^2Rank: Ihr Text-Embedding kann auch ein effektiver und effizienter listenweiser Reranker sein
E^2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker
October 26, 2025
papers.authors: Qi Liu, Yanzhao Zhang, Mingxin Li, Dingkun Long, Pengjun Xie, Jiaxin Mao
cs.AI
papers.abstract
Text-Embedding-Modelle stellen eine grundlegende Komponente in realen Suchanwendungen dar. Durch die Abbildung von Anfragen und Dokumenten in einen gemeinsamen Embedding-Raum liefern sie wettbewerbsfähige Retrieval-Leistung bei hoher Effizienz. Ihre Ranking-Genauigkeit bleibt jedoch im Vergleich zu spezialisierten Rerankern, insbesondere neueren listenbasierten LLM-Rerankern, die feinkörnige Anfrage-Dokument- und Dokument-Dokument-Interaktionen erfassen, begrenzt. In diesem Artikel schlagen wir ein einfaches, aber effektives einheitliches Framework namens E^2Rank vor (steht für Efficient Embedding-based Ranking bzw. Embedding-to-Rank), das ein einzelnes Text-Embedding-Modell erweitert, um sowohl hochwertiges Retrieval als auch listenbasiertes Reranking durch weiterführendes Training unter einem listenbasierten Ranking-Ziel durchzuführen, wodurch starke Effektivität bei bemerkenswerter Effizienz erreicht wird. Indem die Kosinus-Ähnlichkeit zwischen den Anfrage- und Dokument-Embeddings als einheitliche Ranking-Funktion verwendet wird, dient der listenbasierte Ranking-Prompt, der aus der ursprünglichen Anfrage und ihren Kandidatendokumenten konstruiert wird, als eine verbesserte Anfrage, die mit Signalen aus den Top-K-Dokumenten angereichert ist, ähnlich dem Pseudo-Relevance-Feedback (PRF) in traditionellen Retrieval-Modellen. Dieses Design erhält die Effizienz und Repräsentationsqualität des Basis-Embedding-Modells bei gleichzeitiger signifikanter Verbesserung seiner Reranking-Leistung. Empirisch erzielt E^2Rank state-of-the-art Ergebnisse auf dem BEIR-Reranking-Benchmark und zeigt wettbewerbsfähige Leistung auf dem reasoning-intensiven BRIGHT-Benchmark bei sehr geringer Reranking-Latenz. Wir zeigen auch, dass der Ranking-Trainingsprozess die Embedding-Leistung auf dem MTEB-Benchmark verbessert. Unsere Ergebnisse deuten darauf hin, dass ein einzelnes Embedding-Modell Retrieval und Reranking effektiv vereinheitlichen kann und sowohl Recheneffizienz als auch wettbewerbsfähige Ranking-Genauigkeit bietet.
English
Text embedding models serve as a fundamental component in real-world search
applications. By mapping queries and documents into a shared embedding space,
they deliver competitive retrieval performance with high efficiency. However,
their ranking fidelity remains limited compared to dedicated rerankers,
especially recent LLM-based listwise rerankers, which capture fine-grained
query-document and document-document interactions. In this paper, we propose a
simple yet effective unified framework E^2Rank, means Efficient
Embedding-based Ranking (also means Embedding-to-Rank), which extends a single
text embedding model to perform both high-quality retrieval and listwise
reranking through continued training under a listwise ranking objective,
thereby achieving strong effectiveness with remarkable efficiency. By applying
cosine similarity between the query and document embeddings as a unified
ranking function, the listwise ranking prompt, which is constructed from the
original query and its candidate documents, serves as an enhanced query
enriched with signals from the top-K documents, akin to pseudo-relevance
feedback (PRF) in traditional retrieval models. This design preserves the
efficiency and representational quality of the base embedding model while
significantly improving its reranking performance. Empirically,
E^2Rank achieves state-of-the-art results on the BEIR
reranking benchmark and demonstrates competitive performance on the
reasoning-intensive BRIGHT benchmark, with very low reranking latency. We also
show that the ranking training process improves embedding performance on the
MTEB benchmark. Our findings indicate that a single embedding model can
effectively unify retrieval and reranking, offering both computational
efficiency and competitive ranking accuracy.