ChatPaper.aiChatPaper

Exploitation de GPT-4 pour la post-édition automatique de traductions

Leveraging GPT-4 for Automatic Translation Post-Editing

May 24, 2023
Auteurs: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI

Résumé

Bien que la traduction automatique neuronale (NMT) représente l'approche dominante en traduction automatique (MT), les sorties des modèles NMT nécessitent encore une post-édition pour corriger les erreurs et améliorer la qualité, en particulier dans des contextes critiques. Dans ce travail, nous formalisons la tâche de post-édition de traduction avec des modèles de langage de grande taille (LLMs) et explorons l'utilisation de GPT-4 pour post-éditer automatiquement les sorties NMT sur plusieurs paires de langues. Nos résultats démontrent que GPT-4 est compétent en post-édition de traduction et produit des modifications significatives même lorsque la langue cible n'est pas l'anglais. Notamment, nous atteignons des performances de pointe sur les paires de langues WMT-22 anglais-chinois, anglais-allemand, chinois-anglais et allemand-anglais en utilisant la post-édition basée sur GPT-4, telles qu'évaluées par les métriques de qualité de traduction automatique les plus avancées.
English
While Neural Machine Translation (NMT) represents the leading approach to Machine Translation (MT), the outputs of NMT models still require translation post-editing to rectify errors and enhance quality, particularly under critical settings. In this work, we formalize the task of translation post-editing with Large Language Models (LLMs) and explore the use of GPT-4 to automatically post-edit NMT outputs across several language pairs. Our results demonstrate that GPT-4 is adept at translation post-editing and produces meaningful edits even when the target language is not English. Notably, we achieve state-of-the-art performance on WMT-22 English-Chinese, English-German, Chinese-English and German-English language pairs using GPT-4 based post-editing, as evaluated by state-of-the-art MT quality metrics.
PDF10December 15, 2024