Глубокое исследование табличных данных с помощью непрерывного исполнения на основе опыта

Аннотация

Крупные языковые модели часто испытывают трудности со сложными аналитическими задачами длительного горизонта для неструктурированных таблиц, которые обычно характеризуются иерархическими и двунаправленными заголовками, а также неканоническим расположением данных. Мы формализуем эту проблему как Глубокое Табличное Исследование (DTR), требующее многошаговых рассуждений над взаимозависимыми областями таблицы. Для решения задачи DTR мы предлагаем новую агентную архитектуру, которая рассматривает табличные рассуждения как процесс принятия решений в замкнутом контуре. Мы тщательно проектируем связанное понимание запроса и таблицы для принятия решений о пути и операционного выполнения. Конкретно: (i) DTR сначала строит иерархический мета-граф для захвата двунаправленной семантики, отображая естественно-языковые запросы в пространство поиска на уровне операций; (ii) Для навигации в этом пространстве мы вводим стратегию выбора, учитывающую ожидания, которая расставляет приоритеты путям выполнения с высокой полезностью; (iii) Ключевым моментом является то, что результаты исторического выполнения синтезируются в сиамскую структурированную память, то есть параметризованные обновления и абстрагированные тексты, что позволяет осуществлять непрерывное уточнение. Обширные эксперименты на сложных эталонах для неструктурированных таблиц подтверждают эффективность и подчеркивают необходимость разделения стратегического планирования и низкоуровневого выполнения для табличных рассуждений длительного горизонта.

English

Large language models often struggle with complex long-horizon analytical tasks over unstructured tables, which typically feature hierarchical and bidirectional headers and non-canonical layouts. We formalize this challenge as Deep Tabular Research (DTR), requiring multi-step reasoning over interdependent table regions. To address DTR, we propose a novel agentic framework that treats tabular reasoning as a closed-loop decision-making process. We carefully design a coupled query and table comprehension for path decision making and operational execution. Specifically, (i) DTR first constructs a hierarchical meta graph to capture bidirectional semantics, mapping natural language queries into an operation-level search space; (ii) To navigate this space, we introduce an expectation-aware selection policy that prioritizes high-utility execution paths; (iii) Crucially, historical execution outcomes are synthesized into a siamese structured memory, i.e., parameterized updates and abstracted texts, enabling continual refinement. Extensive experiments on challenging unstructured tabular benchmarks verify the effectiveness and highlight the necessity of separating strategic planning from low-level execution for long-horizon tabular reasoning.

Глубокое исследование табличных данных с помощью непрерывного исполнения на основе опыта

Deep Tabular Research via Continual Experience-Driven Execution

Аннотация

Support