Двухканальное обучение для информационного поиска с выполнением инструкций

Аннотация

Исследования в области информационного поиска с выполнением инструкций (IF-IR) изучают поисковые системы, которые должны не только находить документы, релевантные запросу, но и подчиняться явным ограничениям пользователя, таким как обязательные атрибуты, исключения или предпочтения по выводу. Однако большинство систем поиска обучаются в основном на семантическую релевантность и часто не способны отличить документы, соответствующие теме, от тех, которые удовлетворяют инструкции. Мы предлагаем стратегию синтеза данных с двойным представлением, основанную на полярной инверсии: для данного запроса, документа, релевантного согласно инструкции, и сложного негативного примера, который соответствует запросу, но нарушает инструкцию, мы используем большую языковую модель (LLM) для генерации дополнительной инструкции, при которой два документа меняются метками релевантности. Представляя одну и ту же пару документов в условиях дополнительных инструкций, инвертирующих их метки релевантности, обучающий сигнал заставляет систему поиска переоценивать один и тот же набор кандидатов через призму инструкции, а не полагаться на фиксированные тематические признаки. На энкодере с 305 миллионами параметров наш метод улучшает производительность на бенчмарке FollowIR на 45%, превосходя универсальные модели эмбеддингов сопоставимого или большего масштаба. Сравнивая модели при равных бюджетах данных, мы также показываем, что разнообразие данных и контроль выполнения инструкций играют взаимодополняющие роли: первое сохраняет общее качество поиска, а второе повышает чувствительность к инструкциям. Эти результаты подчеркивают ценность целенаправленного синтеза данных для создания поисковых систем, которые одновременно являются широко способными и учитывающими инструкции.

English

Instruction-following information retrieval (IF-IR) studies retrieval systems that must not only find documents relevant to a query, but also obey explicit user constraints such as required attributes, exclusions, or output preferences. However, most retrievers are trained primarily for semantic relevance and often fail to distinguish documents that match the topic from those that satisfy the instruction. We propose a dual-view data synthesis strategy based on polarity reversal: given a query, a document that is relevant under the instruction, and a hard negative that matches the query but violates the instruction, we prompt an LLM to generate a complementary instruction under which the two documents swap relevance labels. By presenting the same document pair under complementary instructions that invert their relevance labels, the training signal forces the retriever to reconsider the same candidate set through the instruction, rather than relying on fixed topical cues. On a 305M-parameter encoder, our method improves performance on the FollowIR benchmark by 45%, surpassing general-purpose embedding models of comparable or larger scale. Through head-to-head comparisons at matched data budgets, we further show that data diversity and instruction supervision play complementary roles: the former preserves general retrieval quality, while the latter improves instruction sensitivity. These results highlight the value of targeted data synthesis for building retrieval systems that are both broadly capable and instruction-aware.

Двухканальное обучение для информационного поиска с выполнением инструкций

Dual-View Training for Instruction-Following Information Retrieval

Аннотация

Support