CORG: Generación de respuestas a partir de contextos complejos e interrelacionados
CORG: Generating Answers from Complex, Interrelated Contexts
April 25, 2025
Autores: Hyunji Lee, Franck Dernoncourt, Trung Bui, Seunghyun Yoon
cs.AI
Resumen
En un corpus del mundo real, el conocimiento recurre frecuentemente a través de documentos, pero a menudo contiene inconsistencias debido a denominaciones ambiguas, información desactualizada o errores, lo que genera interrelaciones complejas entre contextos. Investigaciones previas han demostrado que los modelos de lenguaje tienen dificultades con estas complejidades, ya que suelen centrarse en factores individuales de manera aislada. Clasificamos estas relaciones en cuatro tipos: distractoras, ambiguas, contrafactuales y duplicadas. Nuestro análisis revela que ningún enfoque único aborda eficazmente todas estas interrelaciones de manera simultánea. Por lo tanto, presentamos Context Organizer (CORG), un marco que organiza múltiples contextos en grupos procesados de manera independiente. Este diseño permite que el modelo encuentre eficientemente todas las respuestas relevantes mientras garantiza la desambiguación. CORG consta de tres componentes clave: un constructor de grafos, un reranker y un agregador. Nuestros resultados demuestran que CORG equilibra eficazmente el rendimiento y la eficiencia, superando los métodos de agrupación existentes y logrando resultados comparables a enfoques más intensivos en cómputo basados en un solo contexto.
English
In a real-world corpus, knowledge frequently recurs across documents but
often contains inconsistencies due to ambiguous naming, outdated information,
or errors, leading to complex interrelationships between contexts. Previous
research has shown that language models struggle with these complexities,
typically focusing on single factors in isolation. We classify these
relationships into four types: distracting, ambiguous, counterfactual, and
duplicated. Our analysis reveals that no single approach effectively addresses
all these interrelationships simultaneously. Therefore, we introduce Context
Organizer (CORG), a framework that organizes multiple contexts into
independently processed groups. This design allows the model to efficiently
find all relevant answers while ensuring disambiguation. CORG consists of three
key components: a graph constructor, a reranker, and an aggregator. Our results
demonstrate that CORG balances performance and efficiency effectively,
outperforming existing grouping methods and achieving comparable results to
more computationally intensive, single-context approaches.Summary
AI-Generated Summary