Benutten van GPT-4 voor Automatische Vertaling Nabewerking
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
Auteurs: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
Samenvatting
Hoewel Neurale Machinevertaling (NMT) de toonaangevende benadering voor Machinevertaling (MT) vertegenwoordigt, vereisen de uitvoer van NMT-modellen nog steeds post-editing van vertalingen om fouten te corrigeren en de kwaliteit te verbeteren, vooral in kritieke situaties. In dit werk formaliseren we de taak van vertaling post-editing met Large Language Models (LLMs) en onderzoeken we het gebruik van GPT-4 om automatisch NMT-uitvoer te post-editen voor verschillende taalparen. Onze resultaten tonen aan dat GPT-4 bedreven is in vertaling post-editing en zinvolle aanpassingen produceert, zelfs wanneer de doeltaal niet Engels is. Opmerkelijk is dat we state-of-the-art prestaties behalen op de WMT-22 Engels-Chinees, Engels-Duits, Chinees-Engels en Duits-Engels taalparen met behulp van GPT-4 gebaseerd post-editing, zoals beoordeeld door state-of-the-art MT-kwaliteitsmetrieken.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.