Низкоранговая адаптация масштабирования больших языковых моделей для энергоэффективного распознавания речи
Low-rank Adaptation of Large Language Model Rescoring for Parameter-Efficient Speech Recognition
September 26, 2023
Авторы: Yu Yu, Chao-Han Huck Yang, Jari Kolehmainen, Prashanth G. Shivakumar, Yile Gu, Sungho Ryu, Roger Ren, Qi Luo, Aditya Gourav, I-Fan Chen, Yi-Chieh Liu, Tuan Dinh, Ankur Gandhe, Denis Filimonov, Shalini Ghosh, Andreas Stolcke, Ariya Rastow, Ivan Bulyko
cs.AI
Аннотация
Мы предлагаем систему нейронного языкового моделирования, основанную на низкоранговой адаптации (LoRA), для повторного ранжирования выходных данных распознавания речи. Хотя предобученные языковые модели (LM), такие как BERT, демонстрируют превосходную производительность при повторном ранжировании на втором этапе, высокая вычислительная стоимость масштабирования этапа предобучения и адаптации предобученных моделей к конкретным доменам ограничивают их практическое использование в повторном ранжировании. В данной работе представлен метод, основанный на низкоранговом разложении, для обучения модели BERT для повторного ранжирования и её адаптации к новым доменам с использованием лишь доли (0,08%) предобученных параметров. Эти вставленные матрицы оптимизируются с помощью дискриминативной функции обучения вместе с регуляризационной функцией потерь, основанной на корреляции. Предложенная архитектура низкоранговой адаптации Rescore-BERT (LoRB) оценивается на наборах данных LibriSpeech и внутренних данных с уменьшением времени обучения в 5,4–3,6 раза.
English
We propose a neural language modeling system based on low-rank adaptation
(LoRA) for speech recognition output rescoring. Although pretrained language
models (LMs) like BERT have shown superior performance in second-pass
rescoring, the high computational cost of scaling up the pretraining stage and
adapting the pretrained models to specific domains limit their practical use in
rescoring. Here we present a method based on low-rank decomposition to train a
rescoring BERT model and adapt it to new domains using only a fraction (0.08%)
of the pretrained parameters. These inserted matrices are optimized through a
discriminative training objective along with a correlation-based regularization
loss. The proposed low-rank adaptation Rescore-BERT (LoRB) architecture is
evaluated on LibriSpeech and internal datasets with decreased training times by
factors between 5.4 and 3.6.