Dual-View Training voor Instructievolgende Informatie-Retrieval

Samenvatting

Instruction-following information retrieval (IF-IR) bestudeert retrievalsystemen die niet alleen documenten moeten vinden die relevant zijn voor een zoekopdracht, maar ook expliciete gebruikersbeperkingen moeten opvolgen, zoals vereiste attributen, uitsluitingen of uitvoerpreferenties. De meeste retrievers worden echter primair getraind voor semantische relevantie en slagen er vaak niet in om onderscheid te maken tussen documenten die bij het onderwerp passen en documenten die aan de instructie voldoen. Wij stellen een dual-view datasynthesestrategie voor op basis van polariteitsomkering: gegeven een zoekopdracht, een document dat relevant is volgens de instructie, en een hard negative die bij de zoekopdracht past maar de instructie schendt, laten we een LLM een complementaire instructie genereren waarbij de twee documenten van relevantielabel wisselen. Door hetzelfde documentenpaar onder complementaire instructies te presenteren die hun relevantielabels omkeren, dwingt het trainingssignaal de retriever om dezelfde kandidaatset opnieuw te evalueren via de instructie, in plaats van te vertrouwen op vaste onderwerpgerelateerde signalen. Op een encoder met 305M parameters verbetert onze methode de prestaties op de FollowIR-benchmark met 45%, waardoor algemene inbeddingsmodellen van vergelijkbare of grotere schaal worden overtroffen. Via directe vergelijkingen bij gelijke databudgets tonen we verder aan dat datadiversiteit en instructietoezicht complementaire rollen spelen: de eerste behoudt de algemene retrievalkwaliteit, terwijl de laatste de instructiegevoeligheid verbetert. Deze resultaten benadrukken de waarde van gerichte datasynthese voor het bouwen van retrievalsystemen die zowel breed inzetbaar als instructiebewust zijn.

English

Instruction-following information retrieval (IF-IR) studies retrieval systems that must not only find documents relevant to a query, but also obey explicit user constraints such as required attributes, exclusions, or output preferences. However, most retrievers are trained primarily for semantic relevance and often fail to distinguish documents that match the topic from those that satisfy the instruction. We propose a dual-view data synthesis strategy based on polarity reversal: given a query, a document that is relevant under the instruction, and a hard negative that matches the query but violates the instruction, we prompt an LLM to generate a complementary instruction under which the two documents swap relevance labels. By presenting the same document pair under complementary instructions that invert their relevance labels, the training signal forces the retriever to reconsider the same candidate set through the instruction, rather than relying on fixed topical cues. On a 305M-parameter encoder, our method improves performance on the FollowIR benchmark by 45%, surpassing general-purpose embedding models of comparable or larger scale. Through head-to-head comparisons at matched data budgets, we further show that data diversity and instruction supervision play complementary roles: the former preserves general retrieval quality, while the latter improves instruction sensitivity. These results highlight the value of targeted data synthesis for building retrieval systems that are both broadly capable and instruction-aware.

Dual-View Training voor Instructievolgende Informatie-Retrieval

Dual-View Training for Instruction-Following Information Retrieval

Samenvatting

Support