Comprendere il Linguaggio Digitale della Generazione Alpha: Valutazione dei Sistemi di Sicurezza degli LLM per la Moderazione dei Contenuti
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
Autori: Manisha Mehta, Fausto Giunchiglia
cs.AI
Abstract
Questa ricerca offre una valutazione unica di come i sistemi di intelligenza artificiale interpretano il linguaggio digitale della Generazione Alpha (Gen Alpha, nati tra il 2010 e il 2024). Essendo la prima coorte cresciuta a fianco dell'IA, la Gen Alpha si trova ad affrontare nuove forme di rischio online a causa di un coinvolgimento digitale immersivo e di un crescente disallineamento tra la loro comunicazione in evoluzione e gli strumenti di sicurezza esistenti. Il loro linguaggio distintivo, plasmato dai giochi, dai meme e dalle tendenze guidate dall'IA, spesso nasconde interazioni dannose sia ai moderatori umani che ai sistemi automatizzati. Valutiamo quattro modelli di IA leader (GPT-4, Claude, Gemini e Llama 3) sulla loro capacità di rilevare molestie e manipolazioni mascherate all'interno del discorso della Gen Alpha. Utilizzando un dataset di 100 espressioni recenti provenienti da piattaforme di gioco, social media e contenuti video, lo studio rivela fallimenti critici nella comprensione con implicazioni dirette per la sicurezza online. Questo lavoro contribuisce: (1) un dataset unico nel suo genere che cattura le espressioni della Gen Alpha; (2) un framework per migliorare i sistemi di moderazione dell'IA per la protezione dei giovani; (3) una valutazione multi-prospettica che include sistemi di IA, moderatori umani e genitori, con il contributo diretto di co-ricercatori della Gen Alpha; e (4) un'analisi di come la divergenza linguistica aumenti la vulnerabilità dei giovani. I risultati evidenziano l'urgente necessità di ridisegnare i sistemi di sicurezza in sintonia con la comunicazione giovanile, soprattutto considerando la riluttanza della Gen Alpha a cercare aiuto quando gli adulti non comprendono il loro mondo digitale. Questo studio combina l'intuizione di un ricercatore della Gen Alpha con un'analisi accademica sistematica per affrontare le sfide critiche della sicurezza digitale.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.