ChatPaper.aiChatPaper

TabDSR: Декомпозиция, очистка и логический вывод для сложных численных рассуждений над табличными данными

TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data

November 4, 2025
Авторы: Changjiang Jiang, Fengchang Yu, Haihua Chen, Wei Lu, Jin Zeng
cs.AI

Аннотация

Сложные рассуждения над табличными данными играют ключевую роль в анализе реальных данных, однако крупные языковые модели (LLM) часто демонстрируют низкую производительность из-за сложных запросов, зашумленных данных и ограниченных возможностей численного анализа. Для решения этих проблем мы предлагаем \method — фреймворк, состоящий из: (1) декомпозитора запросов, который разбивает сложные вопросы на части, (2) очистителя таблиц, который фильтрует и очищает зашумленные таблицы, и (3) модуля рассуждений на основе программы мыслей (Program-of-Thoughts, PoT), который генерирует исполняемый код для получения окончательного ответа из очищенной таблицы. Для обеспечения объективной оценки и минимизации утечки данных мы представляем новый набор данных CalTab151, специально разработанный для сложного численного анализа таблиц. Экспериментальные результаты показывают, что \method стабильно превосходит существующие методы, достигая наилучших результатов (state-of-the-art, SOTA) с улучшением точности на 8,79%, 6,08% и 19,87% на наборах данных TAT-QA, TableBench и \method соответственно. Более того, наш фреймворк легко интегрируется с основными LLM, предоставляя надежное решение для сложного табличного численного анализа. Полученные результаты подчеркивают эффективность нашего подхода в повышении производительности LLM для задач сложного табличного численного анализа. Данные и код доступны по запросу.
English
Complex reasoning over tabular data is crucial in real-world data analysis, yet large language models (LLMs) often underperform due to complex queries, noisy data, and limited numerical capabilities. To address these issues, we propose \method, a framework consisting of: (1) a query decomposer that breaks down complex questions, (2) a table sanitizer that cleans and filters noisy tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates executable code to derive the final answer from the sanitized table. To ensure unbiased evaluation and mitigate data leakage, we introduce a new dataset, CalTab151, specifically designed for complex numerical reasoning over tables. Experimental results demonstrate that \method consistently outperforms existing methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and 19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively. Moreover, our framework integrates seamlessly with mainstream LLMs, providing a robust solution for complex tabular numerical reasoning. These findings highlight the effectiveness of our framework in enhancing LLM performance for complex tabular numerical reasoning. Data and code are available upon request.
PDF11December 2, 2025