Mapeando o Cenário da Mídia: Prevendo a Reportagem Factual e o Viés Político Através das Interações na Web
Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions
October 23, 2024
Autores: Dairazalia Sánchez-Cortés, Sergio Burdisso, Esaú Villatoro-Tello, Petr Motlicek
cs.AI
Resumo
A avaliação de viés de fontes de notícias é fundamental para profissionais, organizações e pesquisadores que dependem de evidências verídicas para coleta e relato de informações. Enquanto certos indicadores de viés são discerníveis a partir da análise de conteúdo, descritores como viés político e notícias falsas apresentam desafios maiores. Neste artigo, propomos uma extensão a um método de estimativa de confiabilidade de mídia recentemente apresentado, que se concentra em modelar veículos de comunicação e suas interações web longitudinais. Concretamente, avaliamos o desempenho de classificação de quatro estratégias de aprendizado por reforço em um grande grafo de hiperlinks de mídia de notícias. Nossos experimentos, visando dois descritores de viés desafiadores, relato factual e viés político, mostraram uma melhoria significativa no desempenho no nível da mídia de origem. Além disso, validamos nossos métodos no desafio do laboratório CheckThat! da CLEF 2023, superando os resultados relatados tanto no F1-score quanto na métrica MAE oficial. Além disso, contribuímos ao disponibilizar o maior conjunto de dados anotados de fontes de mídia de notícias, categorizado com rótulos de relato factual e viés político. Nossas descobertas sugerem que perfilar fontes de mídia com base em suas interações de hiperlinks ao longo do tempo é viável, oferecendo uma visão panorâmica das paisagens midiáticas em evolução.
English
Bias assessment of news sources is paramount for professionals,
organizations, and researchers who rely on truthful evidence for information
gathering and reporting. While certain bias indicators are discernible from
content analysis, descriptors like political bias and fake news pose greater
challenges. In this paper, we propose an extension to a recently presented news
media reliability estimation method that focuses on modeling outlets and their
longitudinal web interactions. Concretely, we assess the classification
performance of four reinforcement learning strategies on a large news media
hyperlink graph. Our experiments, targeting two challenging bias descriptors,
factual reporting and political bias, showed a significant performance
improvement at the source media level. Additionally, we validate our methods on
the CLEF 2023 CheckThat! Lab challenge, outperforming the reported results in
both, F1-score and the official MAE metric. Furthermore, we contribute by
releasing the largest annotated dataset of news source media, categorized with
factual reporting and political bias labels. Our findings suggest that
profiling news media sources based on their hyperlink interactions over time is
feasible, offering a bird's-eye view of evolving media landscapes.Summary
AI-Generated Summary