ChatPaper.aiChatPaper

К разработке кросс-языкового обнаружения злоупотреблений в аудио в условиях ограниченных ресурсов с использованием обучения с небольшим числом образцов

Towards Cross-Lingual Audio Abuse Detection in Low-Resource Settings with Few-Shot Learning

December 2, 2024
Авторы: Aditya Narayan Sankaran, Reza Farahbaksh, Noel Crespi
cs.AI

Аннотация

Обнаружение онлайн-контента с оскорблениями, особенно в условиях ограниченных ресурсов и в аудио-модальности, остается мало исследованным. Мы исследуем потенциал предварительно обученных аудио-представлений для обнаружения оскорбительной речи на языках с ограниченными ресурсами, в данном случае, на индийских языках с использованием обучения на небольшом количестве примеров (Few Shot Learning, FSL). Используя мощные представления из моделей, таких как Wav2Vec и Whisper, мы исследуем кросс-языковое обнаружение оскорблений с использованием набора данных ADIMA с помощью FSL. Наш подход интегрирует эти представления в рамках модели-агностического мета-обучения (Model-Agnostic Meta-Learning, MAML) для классификации оскорбительной речи на 10 языках. Мы экспериментируем с различными размерами выборки (50-200), оценивая влияние ограниченных данных на производительность. Кроме того, было проведено исследование визуализации признаков для лучшего понимания поведения модели. Это исследование подчеркивает способность к обобщению предварительно обученных моделей в условиях ограниченных ресурсов и предлагает ценные идеи для обнаружения оскорбительной речи в мультиязычных контекстах.
English
Online abusive content detection, particularly in low-resource settings and within the audio modality, remains underexplored. We investigate the potential of pre-trained audio representations for detecting abusive language in low-resource languages, in this case, in Indian languages using Few Shot Learning (FSL). Leveraging powerful representations from models such as Wav2Vec and Whisper, we explore cross-lingual abuse detection using the ADIMA dataset with FSL. Our approach integrates these representations within the Model-Agnostic Meta-Learning (MAML) framework to classify abusive language in 10 languages. We experiment with various shot sizes (50-200) evaluating the impact of limited data on performance. Additionally, a feature visualization study was conducted to better understand model behaviour. This study highlights the generalization ability of pre-trained models in low-resource scenarios and offers valuable insights into detecting abusive language in multilingual contexts.

Summary

AI-Generated Summary

PDF22December 3, 2024