Datajournalist Agent: Data transformeren in verifieerbare multimodale verhalen
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
Auteurs: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
Samenvatting
Data vertellen verhalen die de samenleving vormgeven; de taak van de datajournalist is om ruwe informatie om te zetten in verhalen die niet-experts kunnen vertrouwen. Een hoogwaardig nieuwsartikel kost een redactieteam weken: het zoeken naar context, het uitvoeren van statistische analyses, het kiezen van een invalshoek en het ontwerpen van visualisaties. Huidige agents kunnen afzonderlijke stappen goed aan: datawetenschaps-agents sluiten de analysecyclus, terwijl ontwerp-agents prachtige websites synthetiseren. Maar kan een agent als een end-to-end datajournalist fungeren? We introduceren Data Journalist Agent (Data2Story), een multi-agent raamwerk dat gespecialiseerde rollen organiseert in één virtuele nieuwsredactie. Data2Story levert twee innovaties. (i) Beweringen zijn onderbouwd met bewijs: een Inspector koppelt elk getal, elke invalshoek en elk medium terug naar data, code of een externe referentie. (ii) Artikelen zijn multimodaal gegenereerd: in plaats van terug te vallen op platte tekst en statische grafieken, redeneert Data2Story over wat lezers willen zien en zet vervolgens multimodale tools in, zoals interactieve kaarten voor geografie en audio voor muziek. We evalueren Data2Story op 18 artikelen, elk met de oorspronkelijk gepubliceerde deskundige versie, langs vier assen: (a) dekkingsgraad van de menselijke vs. agent-invalshoek; (b) rubric-evaluatie met 53 deelnemers over vijf dimensies; (c) computergebruik-agents als beoordelaars, een kostenbesparende proxy voor hoe lezers interactieve artikelen navigeren; en (d) verifieerbaarheid, waarbij een codeverificateur uitspraken opnieuw tegen de data uitvoert en beweringen controleert aan de hand van referenties. Data2Story produceert concurrerende, met bewijs traceerbare multimediaverhalen, met een bijzondere sterkte in transparantie en auditbaarheid. Menselijke artikelen behouden een voorsprong in redactionele invalshoek, creatief ontwerp en presentatie. We positioneren Data2Story als een samenwerkingspartner voor journalisten, die meer op bewijs gebaseerde, transparante en verifieerbare berichtgeving mogelijk maakt. Code en demo's zijn beschikbaar op https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.