「それは私を表すものではない」:AI合成音声サービスにおけるアクセントバイアスとデジタル排除の検証
"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services
April 12, 2025
著者: Shira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit Ghosh
cs.AI
要旨
人工知能(AI)による音声生成および音声クローニング技術の最近の進歩により、自然な音声と正確な音声再現が可能となった。しかし、多様なアクセントや言語的特徴を跨いだ社会技術システムへの影響は十分に理解されていない。本研究では、2つの合成AI音声サービス(SpeechifyとElevenLabs)を、アンケートとインタビューを用いた混合手法で評価し、技術的な性能を評価するとともに、ユーザーの生活経験がこれらの音声技術におけるアクセントの違いに対する認識にどのように影響するかを明らかにする。我々の調査結果は、5つの地域的な英語アクセントにわたる技術的性能の差異を明らかにし、現在の音声生成技術が意図せずに言語的特権やアクセントに基づく差別を強化し、新たな形のデジタル排除を生み出す可能性があることを示している。全体として、本研究は、開発者、政策立案者、組織が公平で社会的に責任あるAI音声技術を確保するための実践的な洞察を提供することで、包括的な設計と規制の必要性を強調している。
English
Recent advances in artificial intelligence (AI) speech generation and voice
cloning technologies have produced naturalistic speech and accurate voice
replication, yet their influence on sociotechnical systems across diverse
accents and linguistic traits is not fully understood. This study evaluates two
synthetic AI voice services (Speechify and ElevenLabs) through a mixed methods
approach using surveys and interviews to assess technical performance and
uncover how users' lived experiences influence their perceptions of accent
variations in these speech technologies. Our findings reveal technical
performance disparities across five regional, English-language accents and
demonstrate how current speech generation technologies may inadvertently
reinforce linguistic privilege and accent-based discrimination, potentially
creating new forms of digital exclusion. Overall, our study highlights the need
for inclusive design and regulation by providing actionable insights for
developers, policymakers, and organizations to ensure equitable and socially
responsible AI speech technologies.Summary
AI-Generated Summary