Agente Jornalista de Dados: Transformando Dados em Histórias Multimodais Verificáveis
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
Autores: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
Resumo
Os dados contam histórias que moldam a sociedade; o trabalho do jornalista de dados é transformar informações brutas em narrativas nas quais leigos possam confiar. Uma reportagem jornalística de alta qualidade leva semanas de uma equipe de redação: busca por contexto, execução de estatísticas, escolha de um ângulo e elaboração de elementos visuais. Agentes recentes lidam bem com etapas individuais: agentes de ciência de dados fecham o ciclo de análise, enquanto agentes de design sintetizam sites visualmente atraentes. Mas será que um agente pode atuar como jornalista de dados do início ao fim? Apresentamos o Agente Jornalista de Dados (Data2Story), uma estrutura multiagente que orquestra papéis especializados em uma única redação virtual. O Data2Story contribui com duas inovações: (i) alegações são fundamentadas em evidências — um Inspetor vincula cada número, ângulo e recurso de volta aos dados, código ou referência externa; (ii) artigos são multimodalmente generativos — em vez de recorrer a texto simples e gráficos estáticos, o Data2Story raciocina sobre o que os leitores desejarão ver e, então, emprega ferramentas multimodais, como mapas interativos para geografia e áudio para música. Avaliamos o Data2Story em 18 artigos, cada um emparelhado com a reportagem especializada originalmente publicada, ao longo de quatro eixos: (a) cobertura de ângulos humano-agente; (b) avaliação por rubrica com 53 participantes em cinco dimensões; (c) agentes de uso computacional como avaliadores, um substituto econômico para a forma como leitores navegam em artigos interativos; e (d) verificabilidade, onde um verificador de código reexecuta declarações com base nos dados e confere alegações em relação a referências. O Data2Story produz histórias multimídia competitivas e rastreáveis por evidências, com especial destaque em transparência e auditabilidade. Artigos humanos mantêm vantagem no ângulo editorial, design criativo e apresentação. Posicionamos o Data2Story como um colaborador para jornalistas, possibilitando uma reportagem mais baseada em evidências, transparente e verificável. Código e demonstrações estão disponíveis em https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.