ChatPaper.aiChatPaper

TCDA: Моделирование дискурсивной осведомленности с ограничениями по потоку для анализа эмоциональных квадруплей в диалогах

TCDA: Thread-Constrained Discourse-Aware Modeling for Conversational Sentiment Quadruple Analysis

May 3, 2026
Авторы: Xinran Li, Xinze Che, Yifan Lyu, Zhiqi Huang, Xiujuan Xu
cs.AI

Аннотация

Анализ аспектно-ориентированных сентиментных квадруплетов в диалогах (DiaASQ) требует учета сложных взаимосвязей в многораундовых беседах. Существующие методы обычно используют простые графовые сверточные сети (GCN), которые вносят структурный шум и не учитывают временную последовательность реплик, или применяют стандартный RoPE, который неявно захватывает относительные расстояния в плоской последовательности, но не позволяет четко разделить синтаксический порядок на уровне токенов от прогрессии на уровне высказываний, а также может страдать от проблемы размытия расстояний. Для решения этих проблем мы предлагаем новую архитектуру, сочетающую ограниченный по тредам ориентированный ациклический граф (TC-DAG) и дискурс-ориентированное вращательное позиционное кодирование (D-RoPE). В частности, TC-DAG отфильтровывает межтредовый шум на основе тредовых ограничений, сохраняет глобальную связность через якорные корневые узлы и инкорпорирует временную последовательность диалога. D-RoPE выравнивает многоуровневую семантику с помощью двухпоточной проекции и многошкальных частотных сигналов, захватывает тредовые зависимости с использованием древовидных расстояний и смягчает проблему размытия расстояний на уровне токенов за счет учета прогрессии на уровне высказываний. Эксперименты на двух эталонных наборах данных подтверждают, что наша архитектура достигает наилучших результатов.
English
Conversational Aspect-based Sentiment Quadruple Analysis (DiaASQ) needs to capture the complex interrelationships in multiple rounds of dialogues. Existing methods usually employ simple Graph Convolutional Networks (GCN), which introduce structural noise and fail to consider the temporal sequence of the dialogues, or use standard RoPE, which implicitly captures relative distances in a flat sequence but cannot clearly separate the token-level syntactic order from the utterance-level progression, and may suffer from the Distance Dilution problem. To address these issues, we propose a new framework that combines Thread-Constrained Directed Acyclic Graph (TC-DAG) and Discourse-Aware Rotary Position Embedding (D-RoPE). Specifically, TC-DAG filters out cross-thread noise based on thread constraints, maintains global connectivity through root anchoring, and incorporates the temporal sequence of the dialogues. D-RoPE aligns multi-layer semantics using dual-stream projection and multi-scale frequency signals, captures thread dependencies using tree-like distances, and alleviates the token-level Distance Dilution problem by incorporating utterance-level progressions. Experimental results on two benchmark datasets demonstrate that our framework achieves state-of-the-art performance.
PDF12May 7, 2026