알파 세대 디지털 언어 이해: 콘텐츠 조정을 위한 LLM 안전성 시스템 평가
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation
May 14, 2025
저자: Manisha Mehta, Fausto Giunchiglia
cs.AI
초록
이 연구는 AI 시스템이 알파 세대(Gen Alpha, 2010-2024년 출생)의 디지털 언어를 어떻게 해석하는지에 대한 독창적인 평가를 제공합니다. AI와 함께 성장한 첫 번째 세대인 알파 세대는 몰입형 디지털 참여와 진화하는 커뮤니케이션과 기존 안전 도구 간의 불일치로 인해 새로운 형태의 온라인 위험에 직면하고 있습니다. 게임, 밈, AI 주도 트렌드로 형성된 그들의 독특한 언어는 종종 인간 중재자와 자동화 시스템 모두로부터 유해한 상호작용을 숨깁니다. 우리는 GPT-4, Claude, Gemini, Llama 3 등 네 가지 주요 AI 모델이 알파 세대 담화 내에서 위장된 괴롭힘과 조작을 탐지하는 능력을 평가합니다. 게임 플랫폼, 소셜 미디어, 비디오 콘텐츠에서 수집된 최근 100개의 표현으로 구성된 데이터셋을 사용하여, 이 연구는 온라인 안전에 직접적인 영향을 미치는 중요한 이해 실패를 드러냅니다. 이 연구는 다음과 같은 기여를 합니다: (1) 알파 세대 표현을 포착한 최초의 데이터셋; (2) 청소년 보호를 위한 AI 중재 시스템 개선을 위한 프레임워크; (3) AI 시스템, 인간 중재자, 부모를 포함한 다중 관점 평가 및 알파 세대 공동 연구자의 직접 참여; (4) 언어적 차이가 청소년의 취약성을 어떻게 증가시키는지에 대한 분석. 연구 결과는 특히 알파 세대가 자신의 디지털 세계를 이해하지 못하는 성인에게 도움을 요청하는 것을 꺼리는 점을 고려할 때, 청소년 커뮤니케이션에 맞춰 안전 시스템을 재설계할 필요성을 강조합니다. 이 연구는 알파 세대 연구자의 통찰과 체계적인 학문적 분석을 결합하여 중요한 디지털 안전 문제를 해결합니다.
English
This research offers a unique evaluation of how AI systems interpret the
digital language of Generation Alpha (Gen Alpha, born 2010-2024). As the first
cohort raised alongside AI, Gen Alpha faces new forms of online risk due to
immersive digital engagement and a growing mismatch between their evolving
communication and existing safety tools. Their distinct language, shaped by
gaming, memes, and AI-driven trends, often conceals harmful interactions from
both human moderators and automated systems. We assess four leading AI models
(GPT-4, Claude, Gemini, and Llama 3) on their ability to detect masked
harassment and manipulation within Gen Alpha discourse. Using a dataset of 100
recent expressions from gaming platforms, social media, and video content, the
study reveals critical comprehension failures with direct implications for
online safety. This work contributes: (1) a first-of-its-kind dataset capturing
Gen Alpha expressions; (2) a framework to improve AI moderation systems for
youth protection; (3) a multi-perspective evaluation including AI systems,
human moderators, and parents, with direct input from Gen Alpha co-researchers;
and (4) an analysis of how linguistic divergence increases youth vulnerability.
Findings highlight the urgent need to redesign safety systems attuned to youth
communication, especially given Gen Alpha reluctance to seek help when adults
fail to understand their digital world. This study combines the insight of a
Gen Alpha researcher with systematic academic analysis to address critical
digital safety challenges.Summary
AI-Generated Summary