ChatPaper.aiChatPaper

SEA-Guard : Sauvegarde multilingue ancrée culturellement pour l'Asie du Sud-Est

SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia

February 2, 2026
papers.authors: Panuthep Tasawong, Jian Gang Ngui, Alham Fikri Aji, Trevor Cohn, Peerat Limkonchotiwat
cs.AI

papers.abstract

Les garde-fous culturellement conscients sont essentiels pour l'alignement des IA dans des contextes réels, où la sécurité dépasse le bon sens et englobe des valeurs locales, des normes et des réglementations spécifiques à chaque région. Cependant, la création d'ensembles de données à grande échelle ancrés culturellement est difficile en raison de ressources limitées et d'une pénurie d'annotateurs natifs. Par conséquent, de nombreux modèles de sécurité reposent sur la traduction automatique de jeux de données anglais, omettant souvent les nuances régionales et culturelles. Nous présentons un nouveau cadre agentiel de génération de données pour créer de manière évolutive des ensembles de données de sécurité authentiques et spécifiques à la région de l'Asie du Sud-Est (ASE). Sur cette base, nous introduisons la famille SEA-Guard, les premiers modèles de sécurité multilingues ancrés dans les contextes culturels de l'ASE. Évalués sur plusieurs benchmarks et variantes culturelles, les modèles SEA-Guard surpassent systématiquement les garde-fous existants dans la détection de contenus sensibles ou nuisibles régionaux tout en maintenant de solides performances de sécurité générale.
English
Culturally aware safeguards are crucial for AI alignment in real-world settings, where safety extends beyond common sense and encompasses diverse local values, norms, and region-specific regulations. However, building large-scale, culturally grounded datasets is challenging due to limited resources and a scarcity of native annotators. Consequently, many safeguard models rely on machine translation of English datasets, often missing regional and cultural nuances. We present a novel agentic data-generation framework to scalably create authentic, region-specific safety datasets for Southeast Asia (SEA). On this foundation, we introduce the SEA-Guard family, the first multilingual safeguard models grounded in SEA cultural contexts. Evaluated across multiple benchmarks and cultural variants, SEA-Guard consistently outperforms existing safeguards at detecting regionally sensitive or harmful content while maintaining strong general safety performance.
PDF22February 7, 2026