GPT-4를 활용한 자동 번역 후편집
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
저자: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
초록
신경망 기계 번역(Neural Machine Translation, NMT)은 기계 번역(Machine Translation, MT)의 주요 접근법으로 자리 잡고 있지만, NMT 모델의 출력물은 여전히 오류를 수정하고 품질을 향상시키기 위해 번역 후 편집(translation post-editing)이 필요하며, 특히 중요한 환경에서는 더욱 그러하다. 본 연구에서는 대형 언어 모델(Large Language Models, LLMs)을 활용한 번역 후 편집 작업을 공식화하고, GPT-4를 사용하여 여러 언어 쌍에 걸쳐 NMT 출력물을 자동으로 후 편집하는 방법을 탐구한다. 우리의 결과는 GPT-4가 번역 후 편역에 능숙하며, 목표 언어가 영어가 아닌 경우에도 의미 있는 편집을 생성할 수 있음을 보여준다. 특히, GPT-4 기반 후 편집을 통해 WMT-22 영어-중국어, 영어-독일어, 중국어-영어 및 독일어-영어 언어 쌍에서 최신 기계 번역 품질 평가 지표를 기준으로 최첨단 성능을 달성하였다.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.