VoxCeleb スピーカー認識チャレンジ: 回顧
The VoxCeleb Speaker Recognition Challenge: A Retrospective
August 27, 2024
著者: Jaesung Huh, Joon Son Chung, Arsha Nagrani, Andrew Brown, Jee-weon Jung, Daniel Garcia-Romero, Andrew Zisserman
cs.AI
要旨
VoxCelebスピーカー認識チャレンジ(VoxSRC)は、2019年から2023年まで毎年開催された一連のチャレンジとワークショップでした。これらのチャレンジは、主にスピーカー認識とダイアリゼーションのタスクを評価し、閉じたトレーニングデータやオープンなトレーニングデータなど、さまざまな設定で行われました。また、ドメイン適応のための監督学習、自己監督学習、半教師付き学習なども含まれています。これらのチャレンジは、各タスクと設定に対して公開されたトレーニングおよび評価データセットを提供し、毎年新しいテストセットがリリースされました。本論文では、これらのチャレンジについてのレビューを提供し、探究した内容、チャレンジ参加者によって開発された方法とその進化、スピーカー検証とダイアリゼーションの分野の現状についても述べます。我々は、共通の評価データセット上でのチャレンジの5回の進捗状況を示し、各年の特別な焦点が参加者のパフォーマンスにどのように影響したかについて詳細な分析を提供します。この論文は、スピーカー認識とダイアリゼーション分野の概要を知りたい研究者と、VoxSRCチャレンジの成功を活用し、失敗を避けたいチャレンジ主催者の両方を対象としています。最後に、現在の分野の強みとオープンな課題について議論します。プロジェクトページ:https://mm.kaist.ac.kr/datasets/voxceleb/voxsrc/workshop.html
English
The VoxCeleb Speaker Recognition Challenges (VoxSRC) were a series of
challenges and workshops that ran annually from 2019 to 2023. The challenges
primarily evaluated the tasks of speaker recognition and diarisation under
various settings including: closed and open training data; as well as
supervised, self-supervised, and semi-supervised training for domain
adaptation. The challenges also provided publicly available training and
evaluation datasets for each task and setting, with new test sets released each
year. In this paper, we provide a review of these challenges that covers: what
they explored; the methods developed by the challenge participants and how
these evolved; and also the current state of the field for speaker verification
and diarisation. We chart the progress in performance over the five
installments of the challenge on a common evaluation dataset and provide a
detailed analysis of how each year's special focus affected participants'
performance. This paper is aimed both at researchers who want an overview of
the speaker recognition and diarisation field, and also at challenge organisers
who want to benefit from the successes and avoid the mistakes of the VoxSRC
challenges. We end with a discussion of the current strengths of the field and
open challenges. Project page :
https://mm.kaist.ac.kr/datasets/voxceleb/voxsrc/workshop.htmlSummary
AI-Generated Summary