Agent journaliste de données : transformer des données en histoires multimodales vérifiables
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
Auteurs: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
Résumé
Les données racontent des histoires qui façonnent la société ; le travail du journaliste de données consiste à transformer des informations brutes en récits auxquels les non-experts peuvent accorder leur confiance. Un article d’actualité de qualité exige plusieurs semaines de travail en rédaction : rechercher le contexte, effectuer des analyses statistiques, choisir un angle et concevoir des visuels. Les agents récents traitent bien les étapes individuelles : les agents spécialisés en science des données bouclent la boucle d’analyse, tandis que les agents de conception génèrent de magnifiques sites web. Mais un agent peut-il agir en tant que journaliste de données de bout en bout ? Nous présentons Data Journalist Agent (Data2Story), un cadre multi-agents qui orchestre des rôles spécialisés au sein d’une unique rédaction virtuelle. Data2Story apporte deux innovations. (i) Les affirmations sont ancrées dans des preuves : un Inspecteur relie chaque nombre, angle et élément à une source de données, à du code ou à une référence externe. (ii) Les articles sont génératifs de manière multimodale : plutôt que de se cantonner à du texte brut et à des graphiques statiques, Data2Story raisonne sur ce que les lecteurs voudront voir, puis déploie des outils multimodaux, tels que des cartes interactives pour la géographie et des fichiers audio pour la musique. Nous évaluons Data2Story sur 18 articles, chacun associé à l’article expert original publié, selon quatre axes : (a) couverture des angles humains vs agents ; (b) évaluation par grille avec 53 participants sur cinq dimensions ; (c) utilisation d’agents d’utilisation informatique comme juges, un proxy économique pour simuler la navigation des lecteurs dans des articles interactifs ; et (d) vérifiabilité, où un vérificateur de code réexécute les affirmations par rapport aux données et contrôle les déclarations par rapport aux références. Data2Story produit des histoires multimédias compétitives, traçables par les preuves, avec une force particulière en matière de transparence et d’auditabilité. Les articles humains conservent un avantage dans l’angle éditorial, la conception créative et la présentation. Nous positionnons Data2Story comme un collaborateur pour les journalistes, permettant un reportage plus fondé sur les preuves, transparent et vérifiable. Le code et les démonstrations sont disponibles sur https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.