GPT-4を活用した自動翻訳ポストエディティング
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
著者: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
要旨
ニューラル機械翻訳(NMT)は機械翻訳(MT)における主要なアプローチであるが、NMTモデルの出力は、特に重要な設定下では、誤りを修正し品質を向上させるために翻訳後編集を必要とする。本研究では、大規模言語モデル(LLM)を用いた翻訳後編集タスクを形式化し、GPT-4を活用して複数の言語ペアにおけるNMT出力の自動後編集を探求する。結果として、GPT-4は翻訳後編集に熟達しており、ターゲット言語が英語でない場合でも有意義な編集を生成することが示された。特に、GPT-4ベースの後編集を用いることで、WMT-22の英語-中国語、英語-ドイツ語、中国語-英語、ドイツ語-英語の言語ペアにおいて、最先端のMT品質評価指標を用いた評価で、最先端の性能を達成した。
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.