CORG : Génération de réponses à partir de contextes complexes et interdépendants

Résumé

Dans un corpus réel, les connaissances réapparaissent fréquemment à travers les documents, mais contiennent souvent des incohérences dues à des désignations ambiguës, des informations obsolètes ou des erreurs, ce qui entraîne des interrelations complexes entre les contextes. Les recherches précédentes ont montré que les modèles de langage peinent à gérer ces complexités, se concentrant généralement sur des facteurs isolés. Nous classons ces relations en quatre types : distrayantes, ambiguës, contrefactuelles et dupliquées. Notre analyse révèle qu’aucune approche unique ne parvient à traiter efficacement toutes ces interrelations simultanément. Par conséquent, nous introduisons Context Organizer (CORG), un cadre qui organise plusieurs contextes en groupes traités de manière indépendante. Cette conception permet au modèle de trouver efficacement toutes les réponses pertinentes tout en assurant une désambiguïsation. CORG se compose de trois éléments clés : un constructeur de graphe, un rerankeur et un agrégateur. Nos résultats démontrent que CORG équilibre efficacement performance et efficacité, surpassant les méthodes de regroupement existantes et obtenant des résultats comparables à des approches plus intensives en calcul, basées sur un contexte unique.

English

In a real-world corpus, knowledge frequently recurs across documents but often contains inconsistencies due to ambiguous naming, outdated information, or errors, leading to complex interrelationships between contexts. Previous research has shown that language models struggle with these complexities, typically focusing on single factors in isolation. We classify these relationships into four types: distracting, ambiguous, counterfactual, and duplicated. Our analysis reveals that no single approach effectively addresses all these interrelationships simultaneously. Therefore, we introduce Context Organizer (CORG), a framework that organizes multiple contexts into independently processed groups. This design allows the model to efficiently find all relevant answers while ensuring disambiguation. CORG consists of three key components: a graph constructor, a reranker, and an aggregator. Our results demonstrate that CORG balances performance and efficiency effectively, outperforming existing grouping methods and achieving comparable results to more computationally intensive, single-context approaches.

CORG : Génération de réponses à partir de contextes complexes et interdépendants

CORG: Generating Answers from Complex, Interrelated Contexts

Résumé

Summary

Support

Support