TCDA: Modelado de Discurso con Restricciones de Hilo para el Análisis de Cuádruples de Sentimiento Conversacional
TCDA: Thread-Constrained Discourse-Aware Modeling for Conversational Sentiment Quadruple Analysis
May 3, 2026
Autores: Xinran Li, Xinze Che, Yifan Lyu, Zhiqi Huang, Xiujuan Xu
cs.AI
Resumen
El Análisis de Cuádruples de Sentimiento Basado en Aspectos Conversacionales (DiaASQ) debe capturar las complejas interrelaciones en diálogos de múltiples turnos. Los métodos existentes suelen emplear Redes de Convolución de Grafos (GCN) simples, que introducen ruido estructural y no consideran la secuencia temporal de los diálogos, o utilizan RoPE estándar, que captura distancias relativas de forma implícita en una secuencia plana pero no puede separar claramente el orden sintáctico a nivel de token de la progresión a nivel de enunciado, y puede sufrir el problema de la Dilución por Distancia. Para abordar estos problemas, proponemos un nuevo marco que combina el Grafo Acíclico Dirigido con Restricciones de Hilo (TC-DAG) y el Embedding de Posición Rotatorio Consciente del Discurso (D-RoPE). Específicamente, TC-DAG filtra el ruido entre hilos basándose en restricciones de hilo, mantiene la conectividad global mediante anclaje a la raíz e incorpora la secuencia temporal de los diálogos. D-RoPE alinea semántica multicapa mediante proyección de doble flujo y señales de frecuencia multiescala, captura dependencias de hilo usando distancias tipo árbol y alivia el problema de Dilución por Distancia a nivel de token incorporando progresiones a nivel de enunciado. Los resultados experimentales en dos conjuntos de datos de referencia demuestran que nuestro marco logra un rendimiento state-of-the-art.
English
Conversational Aspect-based Sentiment Quadruple Analysis (DiaASQ) needs to capture the complex interrelationships in multiple rounds of dialogues. Existing methods usually employ simple Graph Convolutional Networks (GCN), which introduce structural noise and fail to consider the temporal sequence of the dialogues, or use standard RoPE, which implicitly captures relative distances in a flat sequence but cannot clearly separate the token-level syntactic order from the utterance-level progression, and may suffer from the Distance Dilution problem. To address these issues, we propose a new framework that combines Thread-Constrained Directed Acyclic Graph (TC-DAG) and Discourse-Aware Rotary Position Embedding (D-RoPE). Specifically, TC-DAG filters out cross-thread noise based on thread constraints, maintains global connectivity through root anchoring, and incorporates the temporal sequence of the dialogues. D-RoPE aligns multi-layer semantics using dual-stream projection and multi-scale frequency signals, captures thread dependencies using tree-like distances, and alleviates the token-level Distance Dilution problem by incorporating utterance-level progressions. Experimental results on two benchmark datasets demonstrate that our framework achieves state-of-the-art performance.