jina-reranker-v3: Interazione "Last but Not Late" per il Riorganizzazione dei Documenti
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
September 29, 2025
Autori: Feng Wang, Yuqing Li, Han Xiao
cs.AI
Abstract
jina-reranker-v3 è un modello multilingue di riordinamento documenti da 0,6 miliardi di parametri che introduce una nuova interazione "last but not late". A differenza dei modelli a interazione tardiva come ColBERT, che eseguono una codifica separata seguita da un'accoppiamento multi-vettoriale, il nostro approccio esegue un'auto-attenzione causale tra query e documenti all'interno della stessa finestra contestuale, consentendo ricche interazioni cross-documento prima di estrarre gli embedding contestuali dall'ultimo token di ciascun documento. Questa architettura compatta raggiunge prestazioni all'avanguardia su BEIR con un nDCG@10 di 61,94, pur essendo dieci volte più piccola rispetto ai riordinatori generativi listwise.
English
jina-reranker-v3 is a 0.6B parameter multilingual document reranker that
introduces a novel last but not late interaction. Unlike late interaction
models such as ColBERT that perform separate encoding followed by multi-vector
matching, our approach conducts causal self-attention between query and
documents within the same context window, enabling rich cross-document
interactions before extracting contextual embeddings from the last token of
each document. This compact architecture achieves state-of-the-art BEIR
performance with 61.94 nDCG@10 while being ten times smaller than generative
listwise rerankers.