jina-reranker-v3: Späte, aber nicht zu späte Interaktion für das Neusortieren von Dokumenten
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
September 29, 2025
papers.authors: Feng Wang, Yuqing Li, Han Xiao
cs.AI
papers.abstract
jina-reranker-v3 ist ein multilingualer Dokument-Reranker mit 0,6 Milliarden Parametern, der eine neuartige „Last but not Late“-Interaktion einführt. Im Gegensatz zu Late-Interaction-Modellen wie ColBERT, die eine separate Kodierung gefolgt von einer Multi-Vektor-Abgleichung durchführen, führt unser Ansatz kausale Selbstaufmerksamkeit zwischen Anfrage und Dokumenten innerhalb desselben Kontextfensters durch, wodurch umfangreiche dokumentübergreifende Interaktionen ermöglicht werden, bevor kontextuelle Einbettungen aus dem letzten Token jedes Dokuments extrahiert werden. Diese kompakte Architektur erreicht state-of-the-art BEIR-Leistungen mit 61,94 nDCG@10 und ist dabei zehnmal kleiner als generative Listwise-Reranker.
English
jina-reranker-v3 is a 0.6B parameter multilingual document reranker that
introduces a novel last but not late interaction. Unlike late interaction
models such as ColBERT that perform separate encoding followed by multi-vector
matching, our approach conducts causal self-attention between query and
documents within the same context window, enabling rich cross-document
interactions before extracting contextual embeddings from the last token of
each document. This compact architecture achieves state-of-the-art BEIR
performance with 61.94 nDCG@10 while being ten times smaller than generative
listwise rerankers.