CORG: Generazione di risposte da contesti complessi e interconnessi
CORG: Generating Answers from Complex, Interrelated Contexts
April 25, 2025
Autori: Hyunji Lee, Franck Dernoncourt, Trung Bui, Seunghyun Yoon
cs.AI
Abstract
In un corpus reale, la conoscenza ricorre frequentemente tra i documenti ma spesso presenta incongruenze dovute a denominazioni ambigue, informazioni obsolete o errori, portando a relazioni complesse tra i contesti. Ricerche precedenti hanno dimostrato che i modelli linguistici faticano a gestire queste complessità, concentrandosi tipicamente su singoli fattori in isolamento. Classifichiamo queste relazioni in quattro tipi: distraenti, ambigue, controfattuali e duplicate. La nostra analisi rivela che nessun approccio singolo affronta efficacemente tutte queste interrelazioni simultaneamente. Pertanto, introduciamo Context Organizer (CORG), un framework che organizza più contesti in gruppi elaborati in modo indipendente. Questo design consente al modello di trovare in modo efficiente tutte le risposte rilevanti garantendo al contempo la disambiguazione. CORG è composto da tre componenti chiave: un costruttore di grafi, un riordinatore e un aggregatore. I nostri risultati dimostrano che CORG bilancia efficacemente prestazioni ed efficienza, superando i metodi di raggruppamento esistenti e ottenendo risultati comparabili a approcci più intensivi dal punto di vista computazionale basati su contesti singoli.
English
In a real-world corpus, knowledge frequently recurs across documents but
often contains inconsistencies due to ambiguous naming, outdated information,
or errors, leading to complex interrelationships between contexts. Previous
research has shown that language models struggle with these complexities,
typically focusing on single factors in isolation. We classify these
relationships into four types: distracting, ambiguous, counterfactual, and
duplicated. Our analysis reveals that no single approach effectively addresses
all these interrelationships simultaneously. Therefore, we introduce Context
Organizer (CORG), a framework that organizes multiple contexts into
independently processed groups. This design allows the model to efficiently
find all relevant answers while ensuring disambiguation. CORG consists of three
key components: a graph constructor, a reranker, and an aggregator. Our results
demonstrate that CORG balances performance and efficiency effectively,
outperforming existing grouping methods and achieving comparable results to
more computationally intensive, single-context approaches.