ChatPaper.aiChatPaper

SEA-Guard:東南アジアの文化的基盤に立脚した多言語セーフガード

SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia

February 2, 2026
著者: Panuthep Tasawong, Jian Gang Ngui, Alham Fikri Aji, Trevor Cohn, Peerat Limkonchotiwat
cs.AI

要旨

現実世界におけるAIアライメントにおいて、文化的に意識したセーフガードは極めて重要である。安全性は共通認識を超え、多様な地域の価値観、規範、地域特有の規制を含むからだ。しかし、大規模で文化的に根差したデータセットの構築は、リソースの制約や母語話者のアノテーター不足により困難である。その結果、多くのセーフガードモデルは英語データセットの機械翻訳に依存しており、地域や文化のニュアンスを見落としがちだ。本研究では、東南アジア(SEA)向けの真正で地域特化的な安全性データセットを拡張性高く生成する、新しいエージェント型データ生成フレームワークを提案する。この基盤の上に、SEAの文化的文脈に根差した初の多言語セーフガードモデルファミリーであるSEA-Guardを開発した。複数のベンチマークと文化的バリエーションによる評価では、SEA-Guardは地域的に敏感または有害なコンテンツの検出において既存のセーフガードを一貫して上回り、強力な一般的安全性性能も維持した。
English
Culturally aware safeguards are crucial for AI alignment in real-world settings, where safety extends beyond common sense and encompasses diverse local values, norms, and region-specific regulations. However, building large-scale, culturally grounded datasets is challenging due to limited resources and a scarcity of native annotators. Consequently, many safeguard models rely on machine translation of English datasets, often missing regional and cultural nuances. We present a novel agentic data-generation framework to scalably create authentic, region-specific safety datasets for Southeast Asia (SEA). On this foundation, we introduce the SEA-Guard family, the first multilingual safeguard models grounded in SEA cultural contexts. Evaluated across multiple benchmarks and cultural variants, SEA-Guard consistently outperforms existing safeguards at detecting regionally sensitive or harmful content while maintaining strong general safety performance.
PDF22February 7, 2026