ChatPaper.aiChatPaper

Nutzung von GPT-4 für die automatische Übersetzungsnachbearbeitung

Leveraging GPT-4 for Automatic Translation Post-Editing

May 24, 2023
Autoren: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI

Zusammenfassung

Während Neuronale Maschinelle Übersetzung (NMT) den führenden Ansatz in der Maschinellen Übersetzung (MT) darstellt, erfordern die Ausgaben von NMT-Modellen weiterhin eine Übersetzungsnachbearbeitung, um Fehler zu korrigieren und die Qualität zu verbessern, insbesondere in kritischen Anwendungsfällen. In dieser Arbeit formalisieren wir die Aufgabe der Übersetzungsnachbearbeitung mit Großen Sprachmodellen (LLMs) und untersuchen den Einsatz von GPT-4 zur automatischen Nachbearbeitung von NMT-Ausgaben über mehrere Sprachpaare hinweg. Unsere Ergebnisse zeigen, dass GPT-4 für die Übersetzungsnachbearbeitung geeignet ist und sinnvolle Änderungen vornimmt, selbst wenn die Zielsprache nicht Englisch ist. Bemerkenswerterweise erreichen wir mit GPT-4-basierter Nachbearbeitung Spitzenleistungen bei den Sprachpaaren WMT-22 Englisch-Chinesisch, Englisch-Deutsch, Chinesisch-Englisch und Deutsch-Englisch, gemessen an den aktuellsten MT-Qualitätsmetriken.
English
While Neural Machine Translation (NMT) represents the leading approach to Machine Translation (MT), the outputs of NMT models still require translation post-editing to rectify errors and enhance quality, particularly under critical settings. In this work, we formalize the task of translation post-editing with Large Language Models (LLMs) and explore the use of GPT-4 to automatically post-edit NMT outputs across several language pairs. Our results demonstrate that GPT-4 is adept at translation post-editing and produces meaningful edits even when the target language is not English. Notably, we achieve state-of-the-art performance on WMT-22 English-Chinese, English-German, Chinese-English and German-English language pairs using GPT-4 based post-editing, as evaluated by state-of-the-art MT quality metrics.
PDF10December 15, 2024