ChatPaper.aiChatPaper

TabDSR: Scomposizione, Sanitizzazione e Ragionamento per il Ragionamento Numerico Complesso su Dati Tabulari

TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data

November 4, 2025
Autori: Changjiang Jiang, Fengchang Yu, Haihua Chen, Wei Lu, Jin Zeng
cs.AI

Abstract

Il ragionamento complesso su dati tabellari è cruciale nell'analisi dei dati del mondo reale, tuttavia i grandi modelli linguistici (LLM) spesso forniscono prestazioni inferiori a causa di query complesse, dati rumorosi e capacità numeriche limitate. Per affrontare questi problemi, proponiamo \method, un framework costituito da: (1) un decompositore di query che scompone domande complesse, (2) un sanificatore di tabelle che pulisce e filtra tabelle rumorose, e (3) un ragionatore basato su programmi di pensiero (PoT) che genera codice eseguibile per derivare la risposta finale dalla tabella sanificata. Per garantire una valutazione imparziale e mitigare la fuga di dati, introduciamo un nuovo dataset, CalTab151, specificamente progettato per il ragionamento numerico complesso su tabelle. I risultati sperimentali dimostrano che \method supera costantemente i metodi esistenti, raggiungendo prestazioni state-of-the-art (SOTA) con un miglioramento dell'accuratezza dell'8,79%, 6,08% e 19,87% rispettivamente su TAT-QA, TableBench e \method. Inoltre, il nostro framework si integra perfettamente con gli LLM mainstream, fornendo una soluzione robusta per il ragionamento numerico tabellare complesso. Questi risultati evidenziano l'efficacia del nostro framework nel migliorare le prestazioni degli LLM per il ragionamento numerico tabellare complesso. Dati e codice sono disponibili su richiesta.
English
Complex reasoning over tabular data is crucial in real-world data analysis, yet large language models (LLMs) often underperform due to complex queries, noisy data, and limited numerical capabilities. To address these issues, we propose \method, a framework consisting of: (1) a query decomposer that breaks down complex questions, (2) a table sanitizer that cleans and filters noisy tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates executable code to derive the final answer from the sanitized table. To ensure unbiased evaluation and mitigate data leakage, we introduce a new dataset, CalTab151, specifically designed for complex numerical reasoning over tables. Experimental results demonstrate that \method consistently outperforms existing methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and 19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively. Moreover, our framework integrates seamlessly with mainstream LLMs, providing a robust solution for complex tabular numerical reasoning. These findings highlight the effectiveness of our framework in enhancing LLM performance for complex tabular numerical reasoning. Data and code are available upon request.
PDF11December 2, 2025