ChatPaper.aiChatPaper

"Het is geen representatie van mij": Onderzoek naar accentbias en digitale uitsluiting in synthetische AI-stemdiensten

"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services

April 12, 2025
Auteurs: Shira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit Ghosh
cs.AI

Samenvatting

Recente ontwikkelingen in kunstmatige intelligentie (AI) op het gebied van spraakgeneratie en stemklonen hebben geleid tot natuurlijk klinkende spraak en nauwkeurige stemreplicatie, maar hun invloed op sociotechnische systemen in verschillende accenten en linguïstische kenmerken is nog niet volledig begrepen. Deze studie evalueert twee synthetische AI-stemdiensten (Speechify en ElevenLabs) via een mixed-methods-benadering met behulp van enquêtes en interviews om de technische prestaties te beoordelen en te onderzoeken hoe de ervaringen van gebruikers hun perceptie van accentvariatie in deze spraaktechnologieën beïnvloeden. Onze bevindingen onthullen verschillen in technische prestaties bij vijf regionale, Engelstalige accenten en laten zien hoe huidige spraakgeneratietechnologieën onbedoeld linguïstisch privilege en accentgerelateerde discriminatie kunnen versterken, wat mogelijk nieuwe vormen van digitale uitsluiting creëert. Over het algemeen benadrukt onze studie de noodzaak van inclusief ontwerp en regulering door bruikbare inzichten te bieden voor ontwikkelaars, beleidsmakers en organisaties om eerlijke en sociaal verantwoorde AI-spraaktechnologieën te waarborgen.
English
Recent advances in artificial intelligence (AI) speech generation and voice cloning technologies have produced naturalistic speech and accurate voice replication, yet their influence on sociotechnical systems across diverse accents and linguistic traits is not fully understood. This study evaluates two synthetic AI voice services (Speechify and ElevenLabs) through a mixed methods approach using surveys and interviews to assess technical performance and uncover how users' lived experiences influence their perceptions of accent variations in these speech technologies. Our findings reveal technical performance disparities across five regional, English-language accents and demonstrate how current speech generation technologies may inadvertently reinforce linguistic privilege and accent-based discrimination, potentially creating new forms of digital exclusion. Overall, our study highlights the need for inclusive design and regulation by providing actionable insights for developers, policymakers, and organizations to ensure equitable and socially responsible AI speech technologies.

Summary

AI-Generated Summary

PDF42April 17, 2025