ChatPaper.aiChatPaper

Rumo à Detecção de Abuso de Áudio Cross-lingual em Ambientes de Baixos Recursos com Aprendizado de Poucas Instâncias

Towards Cross-Lingual Audio Abuse Detection in Low-Resource Settings with Few-Shot Learning

December 2, 2024
Autores: Aditya Narayan Sankaran, Reza Farahbaksh, Noel Crespi
cs.AI

Resumo

A detecção de conteúdo abusivo online, especialmente em ambientes de recursos limitados e na modalidade de áudio, permanece pouco explorada. Investigamos o potencial de representações de áudio pré-treinadas para detectar linguagem abusiva em idiomas de recursos limitados, neste caso, em idiomas indianos usando Aprendizado com Poucos Exemplos (FSL). Aproveitando representações poderosas de modelos como Wav2Vec e Whisper, exploramos a detecção de abuso entre idiomas usando o conjunto de dados ADIMA com FSL. Nossa abordagem integra essas representações dentro do framework de Aprendizado Meta-Agnóstico de Modelo (MAML) para classificar linguagem abusiva em 10 idiomas. Experimentamos com vários tamanhos de exemplos (50-200), avaliando o impacto de dados limitados no desempenho. Além disso, foi realizada um estudo de visualização de características para entender melhor o comportamento do modelo. Este estudo destaca a capacidade de generalização de modelos pré-treinados em cenários de recursos limitados e oferece insights valiosos para detectar linguagem abusiva em contextos multilíngues.
English
Online abusive content detection, particularly in low-resource settings and within the audio modality, remains underexplored. We investigate the potential of pre-trained audio representations for detecting abusive language in low-resource languages, in this case, in Indian languages using Few Shot Learning (FSL). Leveraging powerful representations from models such as Wav2Vec and Whisper, we explore cross-lingual abuse detection using the ADIMA dataset with FSL. Our approach integrates these representations within the Model-Agnostic Meta-Learning (MAML) framework to classify abusive language in 10 languages. We experiment with various shot sizes (50-200) evaluating the impact of limited data on performance. Additionally, a feature visualization study was conducted to better understand model behaviour. This study highlights the generalization ability of pre-trained models in low-resource scenarios and offers valuable insights into detecting abusive language in multilingual contexts.

Summary

AI-Generated Summary

PDF22December 3, 2024