Геополитические предубеждения в языковых моделях: какие страны считаются «хорошими» и «плохими» согласно современным языковым моделямGeopolitical biases in LLMs: what are the "good" and the "bad" countries
according to contemporary language models
В данной статье проводится оценка геополитических предубеждений в языковых моделях (LLMs) в отношении различных стран на основе анализа их интерпретации исторических событий с противоречивыми национальными перспективами (США, Великобритания, СССР и Китай). Мы представляем новый набор данных, содержащий нейтральные описания событий и контрастирующие точки зрения разных стран. Наши результаты демонстрируют значительные геополитические предубеждения, причем модели склоняются к определённым национальным нарративам. Кроме того, простые методы устранения предубеждений оказались малоэффективными в снижении этих искажений. Эксперименты с изменёнными метками участников выявили чувствительность моделей к атрибуции, иногда усиливающую предубеждения или распознающую несоответствия, особенно при замене меток. Эта работа подчеркивает наличие национальных нарративных предубеждений в LLMs, ставит под сомнение эффективность простых методов устранения предубеждений и предлагает основу и набор данных для будущих исследований геополитических искажений.