ChatPaper.aiChatPaper

FADI-AEC: Modelo de Difusão Baseado em Pontuação Rápida Orientado por Sinal de Extremidade Remota para Cancelamento de Eco Acústico

FADI-AEC: Fast Score Based Diffusion Model Guided by Far-end Signal for Acoustic Echo Cancellation

January 8, 2024
Autores: Yang Liu, Li Wan, Yun Li, Yiteng Huang, Ming Sun, James Luan, Yangyang Shi, Xin Lei
cs.AI

Resumo

Apesar do potencial dos modelos de difusão no aprimoramento de fala, sua implantação no Cancelamento de Eco Acústico (AEC) tem sido limitada. Neste artigo, propomos o DI-AEC, pioneiro em uma abordagem de regeneração estocástica baseada em difusão dedicada ao AEC. Além disso, propomos o FADI-AEC, um framework rápido de AEC baseado em difusão de pontuação para reduzir as demandas computacionais, tornando-o favorável para dispositivos de borda. Ele se destaca por executar o modelo de pontuação uma vez por quadro, alcançando um aumento significativo na eficiência de processamento. Além disso, introduzimos uma nova técnica de geração de ruído em que sinais do lado remoto são utilizados, incorporando tanto sinais do lado remoto quanto do lado próximo para refinar a precisão do modelo de pontuação. Testamos nosso método proposto no conjunto de dados de avaliação do desafio de cancelamento de eco profundo da Microsoft do ICASSP2023, onde nosso método supera alguns dos métodos end-to-end e outros métodos de cancelamento de eco baseados em difusão.
English
Despite the potential of diffusion models in speech enhancement, their deployment in Acoustic Echo Cancellation (AEC) has been restricted. In this paper, we propose DI-AEC, pioneering a diffusion-based stochastic regeneration approach dedicated to AEC. Further, we propose FADI-AEC, fast score-based diffusion AEC framework to save computational demands, making it favorable for edge devices. It stands out by running the score model once per frame, achieving a significant surge in processing efficiency. Apart from that, we introduce a novel noise generation technique where far-end signals are utilized, incorporating both far-end and near-end signals to refine the score model's accuracy. We test our proposed method on the ICASSP2023 Microsoft deep echo cancellation challenge evaluation dataset, where our method outperforms some of the end-to-end methods and other diffusion based echo cancellation methods.
PDF80December 15, 2024