Exploitation de GPT-4 pour la post-édition automatique de traductions
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
Auteurs: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
Résumé
Bien que la traduction automatique neuronale (NMT) représente l'approche dominante en traduction automatique (MT), les sorties des modèles NMT nécessitent encore une post-édition pour corriger les erreurs et améliorer la qualité, en particulier dans des contextes critiques. Dans ce travail, nous formalisons la tâche de post-édition de traduction avec des modèles de langage de grande taille (LLMs) et explorons l'utilisation de GPT-4 pour post-éditer automatiquement les sorties NMT sur plusieurs paires de langues. Nos résultats démontrent que GPT-4 est compétent en post-édition de traduction et produit des modifications significatives même lorsque la langue cible n'est pas l'anglais. Notamment, nous atteignons des performances de pointe sur les paires de langues WMT-22 anglais-chinois, anglais-allemand, chinois-anglais et allemand-anglais en utilisant la post-édition basée sur GPT-4, telles qu'évaluées par les métriques de qualité de traduction automatique les plus avancées.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.