Aproveitando o GPT-4 para Pós-Edição Automática de Traduções
Leveraging GPT-4 for Automatic Translation Post-Editing
May 24, 2023
Autores: Vikas Raunak, Amr Sharaf, Hany Hassan Awadallah, Arul Menezes
cs.AI
Resumo
Embora a Tradução Automática Neural (NMT, do inglês Neural Machine Translation) represente a abordagem líder em Tradução Automática (MT, do inglês Machine Translation), as saídas dos modelos de NMT ainda exigem pós-edição de tradução para corrigir erros e aprimorar a qualidade, especialmente em contextos críticos. Neste trabalho, formalizamos a tarefa de pós-edição de tradução com Modelos de Linguagem de Grande Escala (LLMs, do inglês Large Language Models) e exploramos o uso do GPT-4 para pós-editar automaticamente as saídas de NMT em diversos pares de idiomas. Nossos resultados demonstram que o GPT-4 é habilidoso na pós-edição de tradução e produz edições significativas, mesmo quando o idioma de destino não é o inglês. Notavelmente, alcançamos desempenho de ponta no WMT-22 para os pares de idiomas inglês-chinês, inglês-alemão, chinês-inglês e alemão-inglês utilizando pós-edição baseada no GPT-4, conforme avaliado por métricas de qualidade de MT de última geração.
English
While Neural Machine Translation (NMT) represents the leading approach to
Machine Translation (MT), the outputs of NMT models still require translation
post-editing to rectify errors and enhance quality, particularly under critical
settings. In this work, we formalize the task of translation post-editing with
Large Language Models (LLMs) and explore the use of GPT-4 to automatically
post-edit NMT outputs across several language pairs. Our results demonstrate
that GPT-4 is adept at translation post-editing and produces meaningful edits
even when the target language is not English. Notably, we achieve
state-of-the-art performance on WMT-22 English-Chinese, English-German,
Chinese-English and German-English language pairs using GPT-4 based
post-editing, as evaluated by state-of-the-art MT quality metrics.