ChatPaper.aiChatPaper

Agente de periodismo de datos: transformando datos en historias multimodales verificables

Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories

June 9, 2026
Autores: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI

Resumen

Los datos cuentan historias que moldean la sociedad; el trabajo del periodista de datos es convertir información cruda en historias que los no expertos puedan confiar. Una noticia de alta calidad requiere semanas de trabajo en equipo en una redacción: buscar contexto, ejecutar análisis estadísticos, elegir un ángulo y diseñar visualizaciones. Los agentes recientes manejan bien pasos individuales: los agentes de ciencia de datos cierran el ciclo de análisis, mientras que los agentes de diseño sintetizan sitios web atractivos. Pero, ¿puede un agente actuar como periodista de datos de principio a fin? Presentamos Data Journalist Agent (Data2Story), un marco multiagente que orquesta roles especializados en una única redacción virtual. Data2Story aporta dos innovaciones. (i) Las afirmaciones están fundamentadas en evidencia: un Inspector vincula cada número, ángulo y recurso con datos, código o una referencia externa. (ii) Los artículos son generativos multimodales: en lugar de recurrir a texto plano y gráficos estáticos, Data2Story razona sobre lo que los lectores querrán ver y luego despliega herramientas multimodales, como mapas interactivos para geografía y audio para música. Evaluamos Data2Story en 18 artículos, cada uno emparejado con el artículo experto publicado originalmente, en cuatro ejes: (a) cobertura de ángulos humano-agente; (b) evaluación mediante rúbrica con 53 participantes en cinco dimensiones; (c) agentes de uso computacional como jueces, un proxy de ahorro de costos para cómo los lectores navegan por artículos interactivos; y (d) verificabilidad, donde un verificador de código reejecuta afirmaciones contra los datos y comprueba las afirmaciones con referencias. Data2Story produce historias multimedia competitivas, trazables y fundamentadas en evidencia, con especial fortaleza en transparencia y auditabilidad. Los artículos humanos conservan una ventaja en ángulo editorial, diseño creativo y presentación. Posicionamos a Data2Story como un colaborador para periodistas, que permite una cobertura más basada en evidencia, transparente y verificable. El código y las demostraciones están disponibles en https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.