Comprensión del Lenguaje Digital de la Generación Alfa: Evaluación de los Sistemas de Seguridad de los Modelos de Lenguaje para la Moderación de Contenidos
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
Autores: Manisha Mehta, Fausto Giunchiglia
cs.AI
Resumen
Esta investigación ofrece una evaluación única de cómo los sistemas de IA interpretan el lenguaje digital de la Generación Alfa (Gen Alpha, nacidos entre 2010 y 2024). Como la primera cohorte criada junto a la IA, la Gen Alpha enfrenta nuevas formas de riesgo en línea debido a su inmersión digital y a una creciente desconexión entre su comunicación en evolución y las herramientas de seguridad existentes. Su lenguaje distintivo, moldeado por los videojuegos, los memes y las tendencias impulsadas por la IA, a menudo oculta interacciones dañinas tanto para los moderadores humanos como para los sistemas automatizados. Evaluamos cuatro modelos líderes de IA (GPT-4, Claude, Gemini y Llama 3) en su capacidad para detectar acoso y manipulación enmascarados dentro del discurso de la Gen Alpha. Utilizando un conjunto de datos de 100 expresiones recientes de plataformas de juegos, redes sociales y contenido de video, el estudio revela fallos críticos de comprensión con implicaciones directas para la seguridad en línea. Este trabajo contribuye: (1) un conjunto de datos pionero que captura expresiones de la Gen Alpha; (2) un marco para mejorar los sistemas de moderación de IA para la protección de los jóvenes; (3) una evaluación multiperspectiva que incluye sistemas de IA, moderadores humanos y padres, con aportes directos de co-investigadores de la Gen Alpha; y (4) un análisis de cómo la divergencia lingüística aumenta la vulnerabilidad de los jóvenes. Los hallazgos destacan la urgente necesidad de rediseñar los sistemas de seguridad adaptados a la comunicación juvenil, especialmente dada la renuencia de la Gen Alpha a buscar ayuda cuando los adultos no comprenden su mundo digital. Este estudio combina la perspectiva de un investigador de la Gen Alpha con un análisis académico sistemático para abordar los desafíos críticos de la seguridad digital.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.Summary
AI-Generated Summary