TabDSR: Descomponer, Sanitarizar y Razonar para el Razonamiento Numérico Complejo en Datos Tabulares
TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data
November 4, 2025
Autores: Changjiang Jiang, Fengchang Yu, Haihua Chen, Wei Lu, Jin Zeng
cs.AI
Resumen
El razonamiento complejo sobre datos tabulares es crucial en el análisis de datos del mundo real, sin embargo, los grandes modelos de lenguaje (LLM) a menudo tienen un rendimiento inferior debido a consultas complejas, datos ruidosos y capacidades numéricas limitadas. Para abordar estos problemas, proponemos \method, un marco que consiste en: (1) un descomponedor de consultas que desglosa preguntas complejas, (2) un saneador de tablas que limpia y filtra tablas ruidosas, y (3) un razonador basado en programas de pensamiento (PoT) que genera código ejecutable para derivar la respuesta final a partir de la tabla saneada. Para garantizar una evaluación imparcial y mitigar la filtración de datos, presentamos un nuevo conjunto de datos, CalTab151, diseñado específicamente para el razonamiento numérico complejo sobre tablas. Los resultados experimentales demuestran que \method supera consistentemente a los métodos existentes, logrando un rendimiento de vanguardia (SOTA) con una mejora de precisión del 8,79%, 6,08% y 19,87% en TAT-QA, TableBench y \method, respectivamente. Además, nuestro marco se integra perfectamente con los LLM principales, proporcionando una solución robusta para el razonamiento numérico tabular complejo. Estos hallazgos resaltan la efectividad de nuestro marco para mejorar el rendimiento de los LLM en el razonamiento numérico tabular complejo. Los datos y el código están disponibles bajo petición.
English
Complex reasoning over tabular data is crucial in real-world data analysis,
yet large language models (LLMs) often underperform due to complex queries,
noisy data, and limited numerical capabilities. To address these issues, we
propose \method, a framework consisting of: (1) a query decomposer that breaks
down complex questions, (2) a table sanitizer that cleans and filters noisy
tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates
executable code to derive the final answer from the sanitized table. To ensure
unbiased evaluation and mitigate data leakage, we introduce a new dataset,
CalTab151, specifically designed for complex numerical reasoning over tables.
Experimental results demonstrate that \method consistently outperforms existing
methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and
19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively.
Moreover, our framework integrates seamlessly with mainstream LLMs, providing a
robust solution for complex tabular numerical reasoning. These findings
highlight the effectiveness of our framework in enhancing LLM performance for
complex tabular numerical reasoning. Data and code are available upon request.