ChatPaper.aiChatPaper

Het aanpassen van automatische spraakherkenning voor luchtverkeersleiding met accenten.

Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications

February 27, 2025
Auteurs: Marcus Yu Zhe Wee, Justin Juin Hng Wong, Lynus Lim, Joe Yu Wei Tan, Prannaya Gupta, Dillion Lim, En Hao Tew, Aloysius Keng Siew Han, Yong Zhi Lim
cs.AI

Samenvatting

Effectieve communicatie in de Luchtverkeersleiding (ATC) is cruciaal voor het handhaven van de luchtvaartveiligheid, maar de uitdagingen die worden gesteld door Engels met een accent blijven grotendeels onaangepakt in Automatische Spraakherkenning (ASR) systemen. Bestaande modellen hebben moeite met de nauwkeurigheid van transcriptie voor Zuidoost-Aziatische accenten, met name in lawaaierige ATC-omgevingen. Deze studie presenteert de ontwikkeling van ASR-modellen die specifiek zijn afgestemd op Zuidoost-Aziatische accenten met behulp van een nieuw gecreëerde dataset. Ons onderzoek behaalt significante verbeteringen, met een Woordfoutpercentage (WER) van 0.0982 of 9.82% voor Zuidoost-Aziatisch-geaccentueerde ATC-spraak. Daarnaast benadrukt het artikel het belang van regiospecifieke datasets en accentgerichte training, en biedt het een pad voor het implementeren van ASR-systemen in militaire operaties met beperkte middelen. De bevindingen benadrukken de noodzaak van trainingstechnieken die bestand zijn tegen ruis en regiospecifieke datasets om de transcriptienauwkeurigheid te verbeteren voor niet-westerse accenten in ATC-communicatie.
English
Effective communication in Air Traffic Control (ATC) is critical to maintaining aviation safety, yet the challenges posed by accented English remain largely unaddressed in Automatic Speech Recognition (ASR) systems. Existing models struggle with transcription accuracy for Southeast Asian-accented (SEA-accented) speech, particularly in noisy ATC environments. This study presents the development of ASR models fine-tuned specifically for Southeast Asian accents using a newly created dataset. Our research achieves significant improvements, achieving a Word Error Rate (WER) of 0.0982 or 9.82% on SEA-accented ATC speech. Additionally, the paper highlights the importance of region-specific datasets and accent-focused training, offering a pathway for deploying ASR systems in resource-constrained military operations. The findings emphasize the need for noise-robust training techniques and region-specific datasets to improve transcription accuracy for non-Western accents in ATC communications.
PDF62February 28, 2025