CORG: Генерация ответов на основе сложных взаимосвязанных контекстов

Аннотация

В реальных корпусах текстов знания часто повторяются в различных документах, но нередко содержат несоответствия из-за неоднозначных наименований, устаревшей информации или ошибок, что приводит к сложным взаимосвязям между контекстами. Предыдущие исследования показали, что языковые модели испытывают трудности с такими сложностями, обычно сосредотачиваясь на отдельных факторах изолированно. Мы классифицируем эти взаимосвязи на четыре типа: отвлекающие, неоднозначные, контрфактические и дублированные. Наш анализ показывает, что ни один из существующих подходов не эффективно решает все эти взаимосвязи одновременно. Поэтому мы представляем Context Organizer (CORG) — фреймворк, который организует множественные контексты в независимо обрабатываемые группы. Такая конструкция позволяет модели эффективно находить все релевантные ответы, обеспечивая при этом устранение неоднозначностей. CORG состоит из трех ключевых компонентов: конструктора графов, ранжировщика и агрегатора. Наши результаты демонстрируют, что CORG эффективно балансирует производительность и эффективность, превосходя существующие методы группировки и достигая результатов, сопоставимых с более вычислительно затратными подходами, работающими с единым контекстом.

English

In a real-world corpus, knowledge frequently recurs across documents but often contains inconsistencies due to ambiguous naming, outdated information, or errors, leading to complex interrelationships between contexts. Previous research has shown that language models struggle with these complexities, typically focusing on single factors in isolation. We classify these relationships into four types: distracting, ambiguous, counterfactual, and duplicated. Our analysis reveals that no single approach effectively addresses all these interrelationships simultaneously. Therefore, we introduce Context Organizer (CORG), a framework that organizes multiple contexts into independently processed groups. This design allows the model to efficiently find all relevant answers while ensuring disambiguation. CORG consists of three key components: a graph constructor, a reranker, and an aggregator. Our results demonstrate that CORG balances performance and efficiency effectively, outperforming existing grouping methods and achieving comparable results to more computationally intensive, single-context approaches.

CORG: Генерация ответов на основе сложных взаимосвязанных контекстов

CORG: Generating Answers from Complex, Interrelated Contexts

Аннотация

Support