ChatPaper.aiChatPaper

ChartCitor: Multi-Agent Framework voor Gedetailleerde Grafiek Visual Attribution

ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution

February 3, 2025
Auteurs: Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
cs.AI

Samenvatting

Grote Taalmodellen (LLM's) kunnen complexe vraag-antwoordtaken uitvoeren, maar genereren vaak ongeverifieerde gehallucineerde antwoorden. Bestaande methoden voor antwoordtoewijzing hebben moeite om antwoorden te verankeren in brondiagrammen vanwege beperkte visueel-semantische context, complexe visueel-tekstuele uitlijningsvereisten en moeilijkheden bij het voorspellen van begrenzingskaders over complexe lay-outs. We presenteren ChartCitor, een multi-agent framework dat gedetailleerde begrenzingskadercitaten biedt door ondersteunend bewijs te identificeren binnen diagramafbeeldingen. Het systeem coördineert LLM-agenten om diagram-naar-tabel extractie, antwoordherformulering, tabeluitbreiding, bewijsopvraging via voorfiltering en opnieuw rangschikken, en tabel-naar-diagram mapping uit te voeren. ChartCitor presteert beter dan bestaande baselines over verschillende diagramtypen. Kwalitatieve gebruikersstudies tonen aan dat ChartCitor helpt het vertrouwen van gebruikers in Generatieve AI te vergroten door verbeterde verklaringsmogelijkheden te bieden voor LLM-ondersteunde diagram QA en professionals in staat stelt productiever te zijn.
English
Large Language Models (LLMs) can perform chart question-answering tasks but often generate unverified hallucinated responses. Existing answer attribution methods struggle to ground responses in source charts due to limited visual-semantic context, complex visual-text alignment requirements, and difficulties in bounding box prediction across complex layouts. We present ChartCitor, a multi-agent framework that provides fine-grained bounding box citations by identifying supporting evidence within chart images. The system orchestrates LLM agents to perform chart-to-table extraction, answer reformulation, table augmentation, evidence retrieval through pre-filtering and re-ranking, and table-to-chart mapping. ChartCitor outperforms existing baselines across different chart types. Qualitative user studies show that ChartCitor helps increase user trust in Generative AI by providing enhanced explainability for LLM-assisted chart QA and enables professionals to be more productive.

Summary

AI-Generated Summary

PDF72February 7, 2025