ChatPaper.aiChatPaper

SEA-Guard: Многоязычная система защиты для Юго-Восточной Азии с учетом культурных особенностей

SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia

February 2, 2026
Авторы: Panuthep Tasawong, Jian Gang Ngui, Alham Fikri Aji, Trevor Cohn, Peerat Limkonchotiwat
cs.AI

Аннотация

Культурно-ориентированные защитные механизмы имеют решающее значение для согласования ИИ с реальными условиями, где безопасность выходит за рамки здравого смысла и охватывает разнообразные локальные ценности, нормы и специфические для регионов нормативные акты. Однако создание масштабируемых наборов данных, основанных на культурных особенностях, является сложной задачей из-за ограниченных ресурсов и дефицита аннотаторов — носителей языка. Как следствие, многие защитные модели полагаются на машинный перевод англоязычных наборов данных, зачастую упуская региональные и культурные нюансы. Мы представляем новую агентскую систему генерации данных для масштабируемого создания аутентичных наборов данных по безопасности, специфичных для региона Юго-Восточной Азии (ЮВА). На этой основе мы представляем семейство моделей SEA-Guard — первые многоязычные защитные модели, основанные на культурных контекстах ЮВА. Оценка по множеству эталонных тестов и культурных вариантов показывает, что SEA-Guard последовательно превосходит существующие защитные механизмы в обнаружении регионально-чувствительного или вредоносного контента, сохраняя при этом высокие показатели общей безопасности.
English
Culturally aware safeguards are crucial for AI alignment in real-world settings, where safety extends beyond common sense and encompasses diverse local values, norms, and region-specific regulations. However, building large-scale, culturally grounded datasets is challenging due to limited resources and a scarcity of native annotators. Consequently, many safeguard models rely on machine translation of English datasets, often missing regional and cultural nuances. We present a novel agentic data-generation framework to scalably create authentic, region-specific safety datasets for Southeast Asia (SEA). On this foundation, we introduce the SEA-Guard family, the first multilingual safeguard models grounded in SEA cultural contexts. Evaluated across multiple benchmarks and cultural variants, SEA-Guard consistently outperforms existing safeguards at detecting regionally sensitive or harmful content while maintaining strong general safety performance.
PDF22February 7, 2026