ChatPaper.aiChatPaper

FADI-AEC: Modelo de Difusión Basado en Puntuación Rápida Guiado por Señal de Extremo Lejano para Cancelación de Eco Acústico

FADI-AEC: Fast Score Based Diffusion Model Guided by Far-end Signal for Acoustic Echo Cancellation

January 8, 2024
Autores: Yang Liu, Li Wan, Yun Li, Yiteng Huang, Ming Sun, James Luan, Yangyang Shi, Xin Lei
cs.AI

Resumen

A pesar del potencial de los modelos de difusión en la mejora de voz, su implementación en la Cancelación de Eco Acústico (AEC, por sus siglas en inglés) ha sido limitada. En este artículo, proponemos DI-AEC, pionero en un enfoque de regeneración estocástica basado en difusión dedicado a AEC. Además, presentamos FADI-AEC, un marco rápido de AEC basado en difusión y puntuación para reducir las demandas computacionales, haciéndolo favorable para dispositivos de borde. Destaca al ejecutar el modelo de puntuación una vez por fotograma, logrando un aumento significativo en la eficiencia de procesamiento. Además, introducimos una novedosa técnica de generación de ruido donde se utilizan señales del extremo lejano, incorporando tanto señales del extremo lejano como del extremo cercano para refinar la precisión del modelo de puntuación. Probamos nuestro método propuesto en el conjunto de datos de evaluación del desafío de cancelación de eco profundo de Microsoft ICASSP2023, donde nuestro método supera a algunos de los métodos de extremo a extremo y otros métodos de cancelación de eco basados en difusión.
English
Despite the potential of diffusion models in speech enhancement, their deployment in Acoustic Echo Cancellation (AEC) has been restricted. In this paper, we propose DI-AEC, pioneering a diffusion-based stochastic regeneration approach dedicated to AEC. Further, we propose FADI-AEC, fast score-based diffusion AEC framework to save computational demands, making it favorable for edge devices. It stands out by running the score model once per frame, achieving a significant surge in processing efficiency. Apart from that, we introduce a novel noise generation technique where far-end signals are utilized, incorporating both far-end and near-end signals to refine the score model's accuracy. We test our proposed method on the ICASSP2023 Microsoft deep echo cancellation challenge evaluation dataset, where our method outperforms some of the end-to-end methods and other diffusion based echo cancellation methods.
PDF80December 15, 2024