ChatPaper.aiChatPaper

Folgen Sie dem Fluss: Feinmaschige Flussdiagramm-Zuordnung mit Neurosymbolischen Agenten

Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents

June 2, 2025
Autoren: Manan Suri, Puneet Mathur, Nedim Lipka, Franck Dernoncourt, Ryan A. Rossi, Vivek Gupta, Dinesh Manocha
cs.AI

Zusammenfassung

Flussdiagramme sind ein entscheidendes Werkzeug zur Visualisierung von Entscheidungsprozessen. Ihre nicht-lineare Struktur und die komplexen visuell-textuellen Beziehungen machen es jedoch schwierig, sie mit LLMs (Large Language Models) zu interpretieren, da Vision-Sprach-Modelle häufig nicht existierende Verbindungen und Entscheidungspfade halluzinieren, wenn sie diese Diagramme analysieren. Dies beeinträchtigt die Zuverlässigkeit der automatisierten Flussdiagrammverarbeitung in kritischen Bereichen wie Logistik, Gesundheit und Ingenieurwesen. Wir führen die Aufgabe der Fein-granularen Flussdiagramm-Attribution ein, die spezifische Komponenten nachverfolgt, die eine auf ein Flussdiagramm bezogene LLM-Antwort begründen. Flussdiagramm-Attribution gewährleistet die Überprüfbarkeit von LLM-Vorhersagen und verbessert die Erklärbarkeit, indem generierte Antworten mit der Struktur des Flussdiagramms verknüpft werden. Wir stellen FlowPathAgent vor, einen neurosymbolischen Agenten, der eine fein-granulare post-hoc-Attribution durch graphenbasierte Schlussfolgerung durchführt. Er segmentiert zunächst das Flussdiagramm, wandelt es dann in einen strukturierten symbolischen Graphen um und verwendet einen agentenbasierten Ansatz, um dynamisch mit dem Graphen zu interagieren und Attributionspfade zu generieren. Zusätzlich präsentieren wir FlowExplainBench, einen neuartigen Benchmark zur Bewertung von Flussdiagramm-Attributionen über verschiedene Stile, Domänen und Fragentypen hinweg. Experimentelle Ergebnisse zeigen, dass FlowPathAgent visuelle Halluzinationen in LLM-Antworten auf Flussdiagramm-Fragen reduziert und starke Baseline-Modelle auf unserem vorgeschlagenen FlowExplainBench-Datensatz um 10–14 % übertrifft.
English
Flowcharts are a critical tool for visualizing decision-making processes. However, their non-linear structure and complex visual-textual relationships make it challenging to interpret them using LLMs, as vision-language models frequently hallucinate nonexistent connections and decision paths when analyzing these diagrams. This leads to compromised reliability for automated flowchart processing in critical domains such as logistics, health, and engineering. We introduce the task of Fine-grained Flowchart Attribution, which traces specific components grounding a flowchart referring LLM response. Flowchart Attribution ensures the verifiability of LLM predictions and improves explainability by linking generated responses to the flowchart's structure. We propose FlowPathAgent, a neurosymbolic agent that performs fine-grained post hoc attribution through graph-based reasoning. It first segments the flowchart, then converts it into a structured symbolic graph, and then employs an agentic approach to dynamically interact with the graph, to generate attribution paths. Additionally, we present FlowExplainBench, a novel benchmark for evaluating flowchart attributions across diverse styles, domains, and question types. Experimental results show that FlowPathAgent mitigates visual hallucinations in LLM answers over flowchart QA, outperforming strong baselines by 10-14% on our proposed FlowExplainBench dataset.
PDF42June 5, 2025