Использование GPT-4 для автоматического постредактирования перевода
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
Авторы: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
Аннотация
Хотя нейронный машинный перевод (NMT) представляет собой ведущий подход в области машинного перевода (MT), выходные данные моделей NMT по-прежнему требуют постредактирования для исправления ошибок и повышения качества, особенно в критически важных условиях. В данной работе мы формализуем задачу постредактирования перевода с использованием крупных языковых моделей (LLMs) и исследуем применение GPT-4 для автоматического постредактирования выходных данных NMT для нескольких языковых пар. Наши результаты показывают, что GPT-4 эффективно справляется с постредактированием перевода и вносит значимые правки даже в случаях, когда целевой язык не является английским. В частности, мы достигаем наилучших результатов на языковых парах WMT-22 английский-китайский, английский-немецкий, китайский-английский и немецкий-английский при использовании постредактирования на основе GPT-4, что подтверждается современными метриками качества машинного перевода.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.