ST-Raptor: Полуструктурированный вопросно-ответный механизм на основе крупных языковых моделей для работы с таблицами
ST-Raptor: LLM-Powered Semi-Structured Table Question Answering
August 25, 2025
Авторы: Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu
cs.AI
Аннотация
Полуструктурированные таблицы, широко используемые в реальных приложениях (например, финансовые отчеты, медицинские записи, транзакционные заказы), часто имеют гибкие и сложные макеты (например, иерархические заголовки и объединенные ячейки). Эти таблицы обычно требуют участия аналитиков для интерпретации их структуры и ответов на соответствующие вопросы на естественном языке, что является дорогостоящим и неэффективным процессом. Для автоматизации этой процедуры существующие методы сталкиваются с серьезными трудностями. Во-первых, методы, такие как NL2SQL, требуют преобразования полуструктурированных таблиц в структурированные, что часто приводит к значительной потере информации. Во-вторых, методы, такие как NL2Code и мультимодальные LLM QA, не способны корректно интерпретировать сложные макеты полуструктурированных таблиц и не могут точно отвечать на соответствующие вопросы. Для решения этих проблем мы предлагаем ST-Raptor, древовидную структуру для ответов на вопросы по полуструктурированным таблицам с использованием больших языковых моделей. Во-первых, мы представляем Иерархическое Ортогональное Дерево (HO-Tree), структурную модель, которая учитывает сложные макеты полуструктурированных таблиц, а также эффективный алгоритм для построения этого дерева. Во-вторых, мы определяем набор базовых операций с деревом, чтобы направлять LLM в выполнении типичных задач по ответам на вопросы. При получении вопроса пользователя ST-Raptor разбивает его на более простые подвопросы, генерирует соответствующие цепочки операций с деревом и выполняет выравнивание операций с таблицей для точного выполнения цепочки. В-третьих, мы внедряем двухэтапный механизм проверки: прямая проверка контролирует корректность шагов выполнения, а обратная проверка оценивает надежность ответов путем реконструкции запросов из предсказанных ответов. Для оценки производительности мы представляем SSTQA, набор данных из 764 вопросов по 102 реальным полуструктурированным таблицам. Эксперименты показывают, что ST-Raptor превосходит девять базовых методов на 20% по точности ответов. Код доступен по адресу https://github.com/weAIDB/ST-Raptor.
English
Semi-structured tables, widely used in real-world applications (e.g.,
financial reports, medical records, transactional orders), often involve
flexible and complex layouts (e.g., hierarchical headers and merged cells).
These tables generally rely on human analysts to interpret table layouts and
answer relevant natural language questions, which is costly and inefficient. To
automate the procedure, existing methods face significant challenges. First,
methods like NL2SQL require converting semi-structured tables into structured
ones, which often causes substantial information loss. Second, methods like
NL2Code and multi-modal LLM QA struggle to understand the complex layouts of
semi-structured tables and cannot accurately answer corresponding questions. To
this end, we propose ST-Raptor, a tree-based framework for semi-structured
table question answering using large language models. First, we introduce the
Hierarchical Orthogonal Tree (HO-Tree), a structural model that captures
complex semi-structured table layouts, along with an effective algorithm for
constructing the tree. Second, we define a set of basic tree operations to
guide LLMs in executing common QA tasks. Given a user question, ST-Raptor
decomposes it into simpler sub-questions, generates corresponding tree
operation pipelines, and conducts operation-table alignment for accurate
pipeline execution. Third, we incorporate a two-stage verification mechanism:
forward validation checks the correctness of execution steps, while backward
validation evaluates answer reliability by reconstructing queries from
predicted answers. To benchmark the performance, we present SSTQA, a dataset of
764 questions over 102 real-world semi-structured tables. Experiments show that
ST-Raptor outperforms nine baselines by up to 20% in answer accuracy. The code
is available at https://github.com/weAIDB/ST-Raptor.