TabDSR: Descomponer, Sanitarizar y Razonar para el Razonamiento Numérico Complejo en Datos Tabulares

Resumen

El razonamiento complejo sobre datos tabulares es crucial en el análisis de datos del mundo real, sin embargo, los grandes modelos de lenguaje (LLM) a menudo tienen un rendimiento inferior debido a consultas complejas, datos ruidosos y capacidades numéricas limitadas. Para abordar estos problemas, proponemos \method, un marco que consiste en: (1) un descomponedor de consultas que desglosa preguntas complejas, (2) un saneador de tablas que limpia y filtra tablas ruidosas, y (3) un razonador basado en programas de pensamiento (PoT) que genera código ejecutable para derivar la respuesta final a partir de la tabla saneada. Para garantizar una evaluación imparcial y mitigar la filtración de datos, presentamos un nuevo conjunto de datos, CalTab151, diseñado específicamente para el razonamiento numérico complejo sobre tablas. Los resultados experimentales demuestran que \method supera consistentemente a los métodos existentes, logrando un rendimiento de vanguardia (SOTA) con una mejora de precisión del 8,79%, 6,08% y 19,87% en TAT-QA, TableBench y \method, respectivamente. Además, nuestro marco se integra perfectamente con los LLM principales, proporcionando una solución robusta para el razonamiento numérico tabular complejo. Estos hallazgos resaltan la efectividad de nuestro marco para mejorar el rendimiento de los LLM en el razonamiento numérico tabular complejo. Los datos y el código están disponibles bajo petición.

English

Complex reasoning over tabular data is crucial in real-world data analysis, yet large language models (LLMs) often underperform due to complex queries, noisy data, and limited numerical capabilities. To address these issues, we propose \method, a framework consisting of: (1) a query decomposer that breaks down complex questions, (2) a table sanitizer that cleans and filters noisy tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates executable code to derive the final answer from the sanitized table. To ensure unbiased evaluation and mitigate data leakage, we introduce a new dataset, CalTab151, specifically designed for complex numerical reasoning over tables. Experimental results demonstrate that \method consistently outperforms existing methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and 19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively. Moreover, our framework integrates seamlessly with mainstream LLMs, providing a robust solution for complex tabular numerical reasoning. These findings highlight the effectiveness of our framework in enhancing LLM performance for complex tabular numerical reasoning. Data and code are available upon request.

TabDSR: Descomponer, Sanitarizar y Razonar para el Razonamiento Numérico Complejo en Datos Tabulares

TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data

Resumen

Support