jina-reranker-v3: Взаимодействие "Последнее, но не запоздалое" для повторного ранжирования документов

Аннотация

jina-reranker-v3 представляет собой мультиязычный реранкер документов с 0.6 миллиардами параметров, который вводит новый подход под названием "последнее, но не позднее взаимодействие". В отличие от моделей с поздним взаимодействием, таких как ColBERT, которые выполняют раздельное кодирование с последующим многомерным сопоставлением, наш подход реализует причинное самовнимание между запросом и документами в пределах одного контекстного окна, что позволяет осуществлять богатое кросс-документное взаимодействие перед извлечением контекстных эмбеддингов из последнего токена каждого документа. Эта компактная архитектура достигает наилучших показателей на наборе данных BEIR с 61.94 nDCG@10, будучи при этом в десять раз меньше, чем генеративные реранкеры с поточечным ранжированием.

English

jina-reranker-v3 is a 0.6B parameter multilingual document reranker that introduces a novel last but not late interaction. Unlike late interaction models such as ColBERT that perform separate encoding followed by multi-vector matching, our approach conducts causal self-attention between query and documents within the same context window, enabling rich cross-document interactions before extracting contextual embeddings from the last token of each document. This compact architecture achieves state-of-the-art BEIR performance with 61.94 nDCG@10 while being ten times smaller than generative listwise rerankers.