TabDSR: Zerlegen, Bereinigen und Schließen für komplexes numerisches Schließen in tabellendaten
TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data
November 4, 2025
papers.authors: Changjiang Jiang, Fengchang Yu, Haihua Chen, Wei Lu, Jin Zeng
cs.AI
papers.abstract
Komplexes Schließen über tabellarischen Daten ist entscheidend für die Datenanalyse in der Praxis, doch große Sprachmodelle (LLMs) liefern bei komplexen Abfragen, verrauschten Daten und begrenzten numerischen Fähigkeiten oft unzureichende Ergebnisse. Um diese Probleme zu adressieren, schlagen wir \method vor, ein Framework bestehend aus: (1) einem Abfragezerleger, der komplexe Fragen aufschlüsselt, (2) einem Tabellenbereiniger, der verrauschte Tabellen bereinigt und filtert, und (3) einem Program-of-Thoughts (PoT)-basierten Reasoner, der ausführbaren Code generiert, um die endgültige Antwort aus der bereinigten Tabelle abzuleiten. Um eine verzerrte Evaluation zu vermeiden und Datenlecks zu minimieren, führen wir einen neuen Datensatz, CalTab151, ein, der speziell für komplexes numerisches Schließen über Tabellen entwickelt wurde. Experimentelle Ergebnisse zeigen, dass \method bestehende Methoden konsistent übertrifft und state-of-the-art (SOTA)-Leistung mit Genauigkeitssteigerungen von 8,79 %, 6,08 % bzw. 19,87 % auf TAT-QA, TableBench und \method erzielt. Darüber hinaus integriert sich unser Framework nahtlos in gängige LLMs und bietet so eine robuste Lösung für komplexes tabellarisches numerisches Schließen. Diese Ergebnisse unterstreichen die Wirksamkeit unseres Frameworks zur Verbesserung der LLM-Leistung bei komplexem tabellarischen numerischen Schließen. Daten und Code sind auf Anfrage erhältlich.
English
Complex reasoning over tabular data is crucial in real-world data analysis,
yet large language models (LLMs) often underperform due to complex queries,
noisy data, and limited numerical capabilities. To address these issues, we
propose \method, a framework consisting of: (1) a query decomposer that breaks
down complex questions, (2) a table sanitizer that cleans and filters noisy
tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates
executable code to derive the final answer from the sanitized table. To ensure
unbiased evaluation and mitigate data leakage, we introduce a new dataset,
CalTab151, specifically designed for complex numerical reasoning over tables.
Experimental results demonstrate that \method consistently outperforms existing
methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and
19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively.
Moreover, our framework integrates seamlessly with mainstream LLMs, providing a
robust solution for complex tabular numerical reasoning. These findings
highlight the effectiveness of our framework in enhancing LLM performance for
complex tabular numerical reasoning. Data and code are available upon request.