ChatPaper.aiChatPaper

アクセントのある航空交通管制通信向け自動音声認識の適応

Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications

February 27, 2025
著者: Marcus Yu Zhe Wee, Justin Juin Hng Wong, Lynus Lim, Joe Yu Wei Tan, Prannaya Gupta, Dillion Lim, En Hao Tew, Aloysius Keng Siew Han, Yong Zhi Lim
cs.AI

要旨

航空管制(ATC)における効果的なコミュニケーションは航空安全を維持する上で極めて重要であるが、アクセントのある英語がもたらす課題は、自動音声認識(ASR)システムにおいてほとんど未解決のままである。既存のモデルは、特に騒音の多いATC環境における東南アジアアクセント(SEAアクセント)音声の転写精度に苦戦している。本研究では、新たに作成されたデータセットを用いて、東南アジアアクセントに特化してファインチューニングされたASRモデルの開発を紹介する。私たちの研究は、SEAアクセントのATC音声において、単語誤り率(WER)0.0982(9.82%)という大幅な改善を達成した。さらに、本論文は地域固有のデータセットとアクセントに焦点を当てたトレーニングの重要性を強調し、リソースが限られた軍事作戦におけるASRシステムの展開への道筋を示している。これらの発見は、非西洋アクセントのATC通信における転写精度を向上させるために、ノイズに強いトレーニング技術と地域固有のデータセットの必要性を強調している。
English
Effective communication in Air Traffic Control (ATC) is critical to maintaining aviation safety, yet the challenges posed by accented English remain largely unaddressed in Automatic Speech Recognition (ASR) systems. Existing models struggle with transcription accuracy for Southeast Asian-accented (SEA-accented) speech, particularly in noisy ATC environments. This study presents the development of ASR models fine-tuned specifically for Southeast Asian accents using a newly created dataset. Our research achieves significant improvements, achieving a Word Error Rate (WER) of 0.0982 or 9.82% on SEA-accented ATC speech. Additionally, the paper highlights the importance of region-specific datasets and accent-focused training, offering a pathway for deploying ASR systems in resource-constrained military operations. The findings emphasize the need for noise-robust training techniques and region-specific datasets to improve transcription accuracy for non-Western accents in ATC communications.

Summary

AI-Generated Summary

PDF62February 28, 2025