Compreendendo a Linguagem Digital da Geração Alfa: Avaliação dos Sistemas de Segurança de LLM para Moderação de Conteúdo
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
Autores: Manisha Mehta, Fausto Giunchiglia
cs.AI
Resumo
Esta pesquisa oferece uma avaliação única de como os sistemas de IA interpretam a linguagem digital da Geração Alpha (Gen Alpha, nascidos entre 2010 e 2024). Como a primeira coorte criada ao lado da IA, a Gen Alpha enfrenta novas formas de risco online devido ao engajamento digital imersivo e a uma crescente incompatibilidade entre sua comunicação em evolução e as ferramentas de segurança existentes. Sua linguagem distinta, moldada por jogos, memes e tendências impulsionadas pela IA, frequentemente oculta interações prejudiciais tanto de moderadores humanos quanto de sistemas automatizados. Avaliamos quatro modelos líderes de IA (GPT-4, Claude, Gemini e Llama 3) em sua capacidade de detectar assédio e manipulação mascarados dentro do discurso da Gen Alpha. Utilizando um conjunto de dados de 100 expressões recentes de plataformas de jogos, mídias sociais e conteúdo de vídeo, o estudo revela falhas críticas de compreensão com implicações diretas para a segurança online. Este trabalho contribui com: (1) um conjunto de dados inédito que captura expressões da Gen Alpha; (2) um framework para melhorar os sistemas de moderação de IA para a proteção de jovens; (3) uma avaliação multiperspectiva incluindo sistemas de IA, moderadores humanos e pais, com contribuições diretas de co-pesquisadores da Gen Alpha; e (4) uma análise de como a divergência linguística aumenta a vulnerabilidade dos jovens. Os resultados destacam a necessidade urgente de redesenhar sistemas de segurança sintonizados com a comunicação dos jovens, especialmente considerando a relutância da Gen Alpha em buscar ajuda quando os adultos não entendem seu mundo digital. Este estudo combina a visão de um pesquisador da Gen Alpha com uma análise acadêmica sistemática para abordar desafios críticos de segurança digital.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.