Datenjournalisten-Agent: Daten in verifizierbare multimodale Geschichten verwandeln
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
Autoren: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
Zusammenfassung
Daten erzählen Geschichten, die die Gesellschaft prägen; die Aufgabe des Datenjournalisten besteht darin, rohe Informationen in Geschichten zu verwandeln, denen auch Laien vertrauen können. Eine hochwertige Nachrichtenreportage erfordert wochenlange Arbeit eines Nachrichtenteams: Kontextsuche, statistische Auswertung, Wahl des Blickwinkels und Gestaltung von Visualisierungen. Aktuelle Agenten bewältigen einzelne Schritte gut: Datenwissenschaftsagenten schließen die Analyseschleife, während Designagenten ansprechende Websites synthetisieren. Aber kann ein Agent als Datenjournalist durchgängig fungieren? Wir stellen den Data Journalist Agent (Data2Story) vor, ein Multi-Agenten-Framework, das spezialisierte Rollen in einer einzigen virtuellen Nachrichtenredaktion orchestriert. Data2Story bietet zwei Neuerungen: (i) Aussagen sind evidenzbasiert: Ein Inspector verknüpft jede Zahl, Perspektive und jedes Asset mit den zugrundeliegenden Daten, dem Code oder einer externen Referenz. (ii) Artikel sind multimodal generativ: Statt standardmäßig auf reinen Text und statische Diagramme zurückzugreifen, überlegt Data2Story, was Leser sehen möchten, und setzt dann multimodale Werkzeuge ein, wie interaktive Karten für Geografie und Audio für Musik. Wir evaluieren Data2Story anhand von 18 Artikeln, die jeweils mit der ursprünglich veröffentlichten Expertenarbeit verglichen werden, entlang von vier Achsen: (a) Abdeckung der Blickwinkel zwischen Mensch und Agent; (b) Rubrikenbewertung mit 53 Teilnehmern über fünf Dimensionen; (c) Computer-Use-Agenten als Bewerter, ein kostensparender Proxy für die Navigation von Lesern durch interaktive Artikel; und (d) Überprüfbarkeit, bei der ein Code-Verifizierer Aussagen erneut anhand der Daten ausführt und Behauptungen gegen Referenzen prüft. Data2Story produziert konkurrenzfähige, evidenzbasierte Multimedia-Geschichten, insbesondere mit Stärken in Transparenz und Nachvollziehbarkeit. Menschliche Artikel behalten einen Vorteil in redaktionellem Blickwinkel, kreativem Design und Präsentation. Wir positionieren Data2Story als Kollaborateur für Journalisten, der eine stärker evidenzbasierte, transparente und überprüfbare Berichterstattung ermöglicht. Code und Demos sind verfügbar unter https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.