ChatPaper.aiChatPaper

SEA-Guard: Kulturell Verwahrter Mehrsprachiger Schutzschild für Südostasien

SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia

February 2, 2026
papers.authors: Panuthep Tasawong, Jian Gang Ngui, Alham Fikri Aji, Trevor Cohn, Peerat Limkonchotiwat
cs.AI

papers.abstract

Kulturell sensibilisierte Schutzmechanismen sind entscheidend für die KI-Ausrichtung in realen Anwendungsszenarien, bei denen Sicherheit über gesunden Menschenverstand hinausgeht und vielfältige lokale Werte, Normen und regionsspezifische Vorschriften umfasst. Die Erstellung groß angelegter, kulturell fundierter Datensätze ist jedoch aufgrund begrenzter Ressourcen und eines Mangels an muttersprachlichen Annotatoren eine Herausforderung. Folglich stützen sich viele Schutzmodelle auf maschinelle Übersetzungen englischer Datensätze, wobei häufig regionale und kulturelle Nuancen verloren gehen. Wir stellen einen neuartigen agentenbasierten Rahmen zur Datengenerierung vor, um skalierbar authentische, regionsspezifische Sicherheitsdatensätze für Südostasien (SEA) zu erstellen. Auf dieser Grundlage präsentieren wir die SEA-Guard-Modellfamilie, die ersten mehrsprachigen Schutzmodelle, die in SEA-Kulturkontexten verankert sind. Bewertungen über mehrere Benchmarks und kulturelle Varianten hinweg zeigen, dass SEA-Guard durchgängig bestehende Schutzmechanismen bei der Erkennung regional sensibler oder schädlicher Inhalte übertrifft und gleichzeitig eine hohe allgemeine Sicherheitsleistung beibehält.
English
Culturally aware safeguards are crucial for AI alignment in real-world settings, where safety extends beyond common sense and encompasses diverse local values, norms, and region-specific regulations. However, building large-scale, culturally grounded datasets is challenging due to limited resources and a scarcity of native annotators. Consequently, many safeguard models rely on machine translation of English datasets, often missing regional and cultural nuances. We present a novel agentic data-generation framework to scalably create authentic, region-specific safety datasets for Southeast Asia (SEA). On this foundation, we introduce the SEA-Guard family, the first multilingual safeguard models grounded in SEA cultural contexts. Evaluated across multiple benchmarks and cultural variants, SEA-Guard consistently outperforms existing safeguards at detecting regionally sensitive or harmful content while maintaining strong general safety performance.
PDF22February 7, 2026