LLM의 지리정치적 편향: 현대 언어 모델이 정의한 '좋은' 국가와 '나쁜' 국가Geopolitical biases in LLMs: what are the "good" and the "bad" countries
according to contemporary language models
본 논문은 상충하는 국가적 관점(미국, 영국, 소련, 중국)을 바탕으로 역사적 사건에 대한 해석을 분석함으로써 다양한 국가에 대한 LLM(대형 언어 모델)의 지리정치적 편향을 평가한다. 우리는 중립적인 사건 설명과 각국의 대조적인 관점을 포함한 새로운 데이터셋을 소개한다. 연구 결과, 모델들이 특정 국가의 서사를 선호하는 등 상당한 지리정치적 편향이 나타났다. 또한, 간단한 편향 제거 프롬프트는 이러한 편향을 줄이는 데 제한적인 효과만을 보였다. 조작된 참가자 레이블을 사용한 실험은 모델의 귀속 민감성을 드러냈으며, 특히 레이블이 교환된 경우 편향이 증폭되거나 불일치를 인식하는 경우가 있었다. 이 연구는 LLM의 국가 서사 편향을 강조하고, 간단한 편향 제거 방법의 효과에 의문을 제기하며, 향후 지리정치적 편향 연구를 위한 프레임워크와 데이터셋을 제공한다.