Tiefgehende Forschung zu Tabellendaten durch kontinuierliche erfahrungsgesteuerte Ausführung

Zusammenfassung

Große Sprachmodelle haben oft Schwierigkeiten mit komplexen langfristigen analytischen Aufgaben über unstrukturierten Tabellen, die typischerweise hierarchische und bidirektionale Kopfzeilen sowie nicht-kanonische Layouts aufweisen. Wir formalisieren diese Herausforderung als Deep Tabular Research (DTR), die mehrstufiges Schließen über interdependente Tabellenbereiche erfordert. Um DTR zu adressieren, schlagen wir einen neuartigen agentenbasierten Rahmenansatz vor, der tabellarisches Schließen als einen geschlossenen Entscheidungsprozess behandelt. Wir entwerfen sorgfältig ein gekoppeltes Abfrage- und Tabellenverständnis für Pfadentscheidungen und operative Ausführung. Konkret: (i) DTR konstruiert zunächst einen hierarchischen Metagraphen, um bidirektionale Semantik zu erfassen und natürliche Sprachabfragen in einen operationsbasierten Suchraum abzubilden; (ii) Um diesen Raum zu navigieren, führen wir eine erwartungsbewusste Auswahlstrategie ein, die Ausführungspfade mit hohem Nutzen priorisiert; (iii) Entscheidend ist, dass historische Ausführungsergebnisse in ein siamesisches strukturiertes Gedächtnis synthetisiert werden, d.h. parametrisierte Aktualisierungen und abstrahierte Texte, die eine kontinuierliche Verfeinerung ermöglichen. Umfangreiche Experimente mit anspruchsvollen unstrukturierten Tabellen-Benchmarks verifizieren die Wirksamkeit und unterstreichen die Notwendigkeit, strategische Planung von niedrigschwelliger Ausführung für langfristiges tabellarisches Schließen zu trennen.

English

Large language models often struggle with complex long-horizon analytical tasks over unstructured tables, which typically feature hierarchical and bidirectional headers and non-canonical layouts. We formalize this challenge as Deep Tabular Research (DTR), requiring multi-step reasoning over interdependent table regions. To address DTR, we propose a novel agentic framework that treats tabular reasoning as a closed-loop decision-making process. We carefully design a coupled query and table comprehension for path decision making and operational execution. Specifically, (i) DTR first constructs a hierarchical meta graph to capture bidirectional semantics, mapping natural language queries into an operation-level search space; (ii) To navigate this space, we introduce an expectation-aware selection policy that prioritizes high-utility execution paths; (iii) Crucially, historical execution outcomes are synthesized into a siamese structured memory, i.e., parameterized updates and abstracted texts, enabling continual refinement. Extensive experiments on challenging unstructured tabular benchmarks verify the effectiveness and highlight the necessity of separating strategic planning from low-level execution for long-horizon tabular reasoning.

Tiefgehende Forschung zu Tabellendaten durch kontinuierliche erfahrungsgesteuerte Ausführung

Deep Tabular Research via Continual Experience-Driven Execution

Zusammenfassung

Support