Comprendre le langage numérique de la Génération Alpha : Évaluation des systèmes de sécurité des LLM pour la modération de contenu
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
Auteurs: Manisha Mehta, Fausto Giunchiglia
cs.AI
Résumé
Cette recherche propose une évaluation unique de la manière dont les systèmes d'IA interprètent le langage numérique de la Génération Alpha (Gen Alpha, née entre 2010 et 2024). En tant que première cohorte élevée aux côtés de l'IA, la Gen Alpha est confrontée à de nouvelles formes de risques en ligne en raison d'un engagement numérique immersif et d'un décalage croissant entre leur communication évolutive et les outils de sécurité existants. Leur langage distinct, façonné par les jeux, les mèmes et les tendances pilotées par l'IA, masque souvent des interactions nuisibles, tant pour les modérateurs humains que pour les systèmes automatisés. Nous évaluons quatre modèles d'IA de pointe (GPT-4, Claude, Gemini et Llama 3) sur leur capacité à détecter le harcèlement et la manipulation dissimulés dans le discours de la Gen Alpha. En utilisant un ensemble de données de 100 expressions récentes provenant de plateformes de jeux, de réseaux sociaux et de contenus vidéo, l'étude révèle des lacunes critiques de compréhension ayant des implications directes pour la sécurité en ligne. Ce travail contribue : (1) un ensemble de données inédit capturant les expressions de la Gen Alpha ; (2) un cadre pour améliorer les systèmes de modération par IA pour la protection des jeunes ; (3) une évaluation multi-perspectives incluant les systèmes d'IA, les modérateurs humains et les parents, avec la contribution directe de co-chercheurs de la Gen Alpha ; et (4) une analyse de la manière dont la divergence linguistique accroît la vulnérabilité des jeunes. Les résultats soulignent le besoin urgent de repenser les systèmes de sécurité adaptés à la communication des jeunes, surtout compte tenu de la réticence de la Gen Alpha à demander de l'aide lorsque les adultes ne comprennent pas leur monde numérique. Cette étude combine les insights d'un chercheur de la Gen Alpha avec une analyse académique systématique pour relever les défis critiques de la sécurité numérique.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.Summary
AI-Generated Summary