CORG: Gerando Respostas a partir de Contextos Complexos e Inter-relacionados
CORG: Generating Answers from Complex, Interrelated Contexts
April 25, 2025
Autores: Hyunji Lee, Franck Dernoncourt, Trung Bui, Seunghyun Yoon
cs.AI
Resumo
Em um corpus do mundo real, o conhecimento frequentemente se repete entre documentos, mas muitas vezes contém inconsistências devido a nomenclaturas ambíguas, informações desatualizadas ou erros, resultando em inter-relações complexas entre contextos. Pesquisas anteriores mostraram que os modelos de linguagem têm dificuldades com essas complexidades, geralmente focando em fatores isolados. Classificamos essas relações em quatro tipos: distrativas, ambíguas, contrafactuais e duplicadas. Nossa análise revela que nenhuma abordagem única é eficaz para lidar com todas essas inter-relações simultaneamente. Portanto, introduzimos o Context Organizer (CORG), um framework que organiza múltiplos contextos em grupos processados de forma independente. Esse design permite que o modelo encontre eficientemente todas as respostas relevantes enquanto garante a desambiguação. O CORG consiste em três componentes principais: um construtor de grafos, um reranker e um agregador. Nossos resultados demonstram que o CORG equilibra desempenho e eficiência de forma eficaz, superando métodos de agrupamento existentes e alcançando resultados comparáveis a abordagens mais intensivas computacionalmente, baseadas em contexto único.
English
In a real-world corpus, knowledge frequently recurs across documents but
often contains inconsistencies due to ambiguous naming, outdated information,
or errors, leading to complex interrelationships between contexts. Previous
research has shown that language models struggle with these complexities,
typically focusing on single factors in isolation. We classify these
relationships into four types: distracting, ambiguous, counterfactual, and
duplicated. Our analysis reveals that no single approach effectively addresses
all these interrelationships simultaneously. Therefore, we introduce Context
Organizer (CORG), a framework that organizes multiple contexts into
independently processed groups. This design allows the model to efficiently
find all relevant answers while ensuring disambiguation. CORG consists of three
key components: a graph constructor, a reranker, and an aggregator. Our results
demonstrate that CORG balances performance and efficiency effectively,
outperforming existing grouping methods and achieving comparable results to
more computationally intensive, single-context approaches.