Benutten van GPT-4 voor Automatische Vertaling Nabewerking

Samenvatting

Hoewel Neurale Machinevertaling (NMT) de toonaangevende benadering voor Machinevertaling (MT) vertegenwoordigt, vereisen de uitvoer van NMT-modellen nog steeds post-editing van vertalingen om fouten te corrigeren en de kwaliteit te verbeteren, vooral in kritieke situaties. In dit werk formaliseren we de taak van vertaling post-editing met Large Language Models (LLMs) en onderzoeken we het gebruik van GPT-4 om automatisch NMT-uitvoer te post-editen voor verschillende taalparen. Onze resultaten tonen aan dat GPT-4 bedreven is in vertaling post-editing en zinvolle aanpassingen produceert, zelfs wanneer de doeltaal niet Engels is. Opmerkelijk is dat we state-of-the-art prestaties behalen op de WMT-22 Engels-Chinees, Engels-Duits, Chinees-Engels en Duits-Engels taalparen met behulp van GPT-4 gebaseerd post-editing, zoals beoordeeld door state-of-the-art MT-kwaliteitsmetrieken.

English

While Neural Machine Translation (NMT) represents the leading approach to Machine Translation (MT), the outputs of NMT models still require translation post-editing to rectify errors and enhance quality, particularly under critical settings. In this work, we formalize the task of translation post-editing with Large Language Models (LLMs) and explore the use of GPT-4 to automatically post-edit NMT outputs across several language pairs. Our results demonstrate that GPT-4 is adept at translation post-editing and produces meaningful edits even when the target language is not English. Notably, we achieve state-of-the-art performance on WMT-22 English-Chinese, English-German, Chinese-English and German-English language pairs using GPT-4 based post-editing, as evaluated by state-of-the-art MT quality metrics.

Benutten van GPT-4 voor Automatische Vertaling Nabewerking

Leveraging GPT-4 for Automatic Translation Post-Editing

Samenvatting

Support