jina-reranker-v3 : Interaction finale mais non tardive pour le réordonnancement de documents
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
September 29, 2025
papers.authors: Feng Wang, Yuqing Li, Han Xiao
cs.AI
papers.abstract
jina-reranker-v3 est un rerankeur de documents multilingue à 0,6 milliard de paramètres qui introduit une nouvelle interaction dite « last but not late ». Contrairement aux modèles à interaction tardive comme ColBERT, qui effectuent un encodage séparé suivi d'une correspondance multi-vecteurs, notre approche réalise une auto-attention causale entre la requête et les documents dans la même fenêtre contextuelle, permettant des interactions riches entre les documents avant d'extraire les embeddings contextuels à partir du dernier token de chaque document. Cette architecture compacte atteint des performances de pointe sur BEIR avec un nDCG@10 de 61,94 tout en étant dix fois plus petite que les rerankeurs génératifs de type listwise.
English
jina-reranker-v3 is a 0.6B parameter multilingual document reranker that
introduces a novel last but not late interaction. Unlike late interaction
models such as ColBERT that perform separate encoding followed by multi-vector
matching, our approach conducts causal self-attention between query and
documents within the same context window, enabling rich cross-document
interactions before extracting contextual embeddings from the last token of
each document. This compact architecture achieves state-of-the-art BEIR
performance with 61.94 nDCG@10 while being ten times smaller than generative
listwise rerankers.