ChartCitor: Multi-Agent-Framework für feingranulare Chart-Visualisierungsattribution

papers.abstract

Große Sprachmodelle (LLMs) können Chart-Frage-Antwort-Aufgaben ausführen, generieren jedoch häufig nicht überprüfte halluzinierte Antworten. Bestehende Antwortattributionsmethoden haben Schwierigkeiten, Antworten in Quellgrafiken zu verankern, aufgrund begrenzter visuell-semantischer Kontexte, komplexer visuell-textueller Ausrichtungsanforderungen und Schwierigkeiten bei der Begrenzungsfeldvorhersage über komplexe Layouts. Wir stellen ChartCitor vor, ein Multi-Agenten-Framework, das feinkörnige Begrenzungsfeldzitate bereitstellt, indem es unterstützende Beweise innerhalb von Diagrammbildern identifiziert. Das System orchestriert LLM-Agenten, um Diagramm-zu-Tabelle-Extraktion, Antwortneuformulierung, Tabellenerweiterung, Beweisrückgewinnung durch Vorfilterung und Neu-Ranking sowie Tabellen-zu-Diagramm-Zuordnung durchzuführen. ChartCitor übertrifft bestehende Baselines bei verschiedenen Diagrammtypen. Qualitative Benutzerstudien zeigen, dass ChartCitor dazu beiträgt, das Nutzervertrauen in Generative KI zu steigern, indem es eine verbesserte Erklärbarkeit für LLM-unterstützte Diagramm-F&A bietet und Fachleuten ermöglicht, produktiver zu sein.

English

Large Language Models (LLMs) can perform chart question-answering tasks but often generate unverified hallucinated responses. Existing answer attribution methods struggle to ground responses in source charts due to limited visual-semantic context, complex visual-text alignment requirements, and difficulties in bounding box prediction across complex layouts. We present ChartCitor, a multi-agent framework that provides fine-grained bounding box citations by identifying supporting evidence within chart images. The system orchestrates LLM agents to perform chart-to-table extraction, answer reformulation, table augmentation, evidence retrieval through pre-filtering and re-ranking, and table-to-chart mapping. ChartCitor outperforms existing baselines across different chart types. Qualitative user studies show that ChartCitor helps increase user trust in Generative AI by providing enhanced explainability for LLM-assisted chart QA and enables professionals to be more productive.

ChartCitor: Multi-Agent-Framework für feingranulare Chart-Visualisierungsattribution

ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution

papers.abstract

Support