ChatPaper.aiChatPaper

SEA-Guard: Salvaguardia Multilingüe con Base Cultural para el Sudeste Asiático

SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia

February 2, 2026
Autores: Panuthep Tasawong, Jian Gang Ngui, Alham Fikri Aji, Trevor Cohn, Peerat Limkonchotiwat
cs.AI

Resumen

Las salvaguardas culturalmente conscientes son cruciales para la alineación de la IA en entornos reales, donde la seguridad va más allá del sentido común y abarca diversos valores locales, normas y regulaciones específicas de cada región. Sin embargo, la construcción de conjuntos de datos a gran escala con bases culturales es un desafío debido a los recursos limitados y a la escasez de anotadores nativos. En consecuencia, muchos modelos de salvaguarda dependen de la traducción automática de conjuntos de datos en inglés, perdiendo a menudo matices regionales y culturales. Presentamos un novedoso marco de generación de datos agéntico para crear de forma escalable conjuntos de datos de seguridad auténticos y específicos para la región del Sudeste Asiático (SEA). Sobre esta base, presentamos la familia SEA-Guard, los primeros modelos de salvaguarda multilingües basados en contextos culturales del SEA. Evaluados en múltiples puntos de referencia y variantes culturales, SEA-Guard supera consistentemente a las salvaguardas existentes en la detección de contenido regionalmente sensible o dañino, manteniendo al mismo tiempo un sólido rendimiento de seguridad general.
English
Culturally aware safeguards are crucial for AI alignment in real-world settings, where safety extends beyond common sense and encompasses diverse local values, norms, and region-specific regulations. However, building large-scale, culturally grounded datasets is challenging due to limited resources and a scarcity of native annotators. Consequently, many safeguard models rely on machine translation of English datasets, often missing regional and cultural nuances. We present a novel agentic data-generation framework to scalably create authentic, region-specific safety datasets for Southeast Asia (SEA). On this foundation, we introduce the SEA-Guard family, the first multilingual safeguard models grounded in SEA cultural contexts. Evaluated across multiple benchmarks and cultural variants, SEA-Guard consistently outperforms existing safeguards at detecting regionally sensitive or harmful content while maintaining strong general safety performance.
PDF22February 7, 2026