Понимание цифрового языка поколения Alpha: оценка систем безопасности языковых моделей для модерации контента
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
Авторы: Manisha Mehta, Fausto Giunchiglia
cs.AI
Аннотация
Данное исследование предлагает уникальную оценку того, как системы искусственного интеллекта (ИИ) интерпретируют цифровой язык поколения Альфа (Gen Alpha, рожденные в 2010–2024 годах). Как первое поколение, выросшее вместе с ИИ, Gen Alpha сталкивается с новыми формами онлайн-рисков из-за глубокого погружения в цифровую среду и растущего несоответствия между их развивающимися способами коммуникации и существующими инструментами безопасности. Их уникальный язык, сформированный под влиянием игр, мемов и трендов, движимых ИИ, часто скрывает вредоносные взаимодействия как от человеческих модераторов, так и от автоматизированных систем. Мы оцениваем четыре ведущие модели ИИ (GPT-4, Claude, Gemini и Llama 3) на их способность выявлять замаскированные случаи домогательств и манипуляций в дискурсе Gen Alpha. Используя набор данных из 100 недавних выражений с игровых платформ, социальных сетей и видеоконтента, исследование выявляет критические пробелы в понимании, имеющие прямые последствия для онлайн-безопасности. Эта работа вносит вклад: (1) в создание первого в своем роде набора данных, фиксирующего выражения Gen Alpha; (2) в разработку структуры для улучшения систем модерации ИИ с целью защиты молодежи; (3) в многоаспектную оценку, включающую системы ИИ, человеческих модераторов и родителей, с прямым участием исследователей из числа Gen Alpha; и (4) в анализ того, как лингвистическое расхождение увеличивает уязвимость молодежи. Результаты подчеркивают острую необходимость перепроектирования систем безопасности, адаптированных к молодежной коммуникации, особенно с учетом нежелания Gen Alpha обращаться за помощью, когда взрослые не понимают их цифровой мир. Это исследование объединяет инсайты исследователя из Gen Alpha с систематическим академическим анализом для решения критических задач цифровой безопасности.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.Summary
AI-Generated Summary