Nutzung von GPT-4 für die automatische Übersetzungsnachbearbeitung
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
Autoren: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
Zusammenfassung
Während Neuronale Maschinelle Übersetzung (NMT) den führenden Ansatz in der Maschinellen Übersetzung (MT) darstellt, erfordern die Ausgaben von NMT-Modellen weiterhin eine Übersetzungsnachbearbeitung, um Fehler zu korrigieren und die Qualität zu verbessern, insbesondere in kritischen Anwendungsfällen. In dieser Arbeit formalisieren wir die Aufgabe der Übersetzungsnachbearbeitung mit Großen Sprachmodellen (LLMs) und untersuchen den Einsatz von GPT-4 zur automatischen Nachbearbeitung von NMT-Ausgaben über mehrere Sprachpaare hinweg. Unsere Ergebnisse zeigen, dass GPT-4 für die Übersetzungsnachbearbeitung geeignet ist und sinnvolle Änderungen vornimmt, selbst wenn die Zielsprache nicht Englisch ist. Bemerkenswerterweise erreichen wir mit GPT-4-basierter Nachbearbeitung Spitzenleistungen bei den Sprachpaaren WMT-22 Englisch-Chinesisch, Englisch-Deutsch, Chinesisch-Englisch und Deutsch-Englisch, gemessen an den aktuellsten MT-Qualitätsmetriken.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.