Aproveitando o GPT-4 para Pós-Edição Automática de Traduções

Resumo

Embora a Tradução Automática Neural (NMT, do inglês Neural Machine Translation) represente a abordagem líder em Tradução Automática (MT, do inglês Machine Translation), as saídas dos modelos de NMT ainda exigem pós-edição de tradução para corrigir erros e aprimorar a qualidade, especialmente em contextos críticos. Neste trabalho, formalizamos a tarefa de pós-edição de tradução com Modelos de Linguagem de Grande Escala (LLMs, do inglês Large Language Models) e exploramos o uso do GPT-4 para pós-editar automaticamente as saídas de NMT em diversos pares de idiomas. Nossos resultados demonstram que o GPT-4 é habilidoso na pós-edição de tradução e produz edições significativas, mesmo quando o idioma de destino não é o inglês. Notavelmente, alcançamos desempenho de ponta no WMT-22 para os pares de idiomas inglês-chinês, inglês-alemão, chinês-inglês e alemão-inglês utilizando pós-edição baseada no GPT-4, conforme avaliado por métricas de qualidade de MT de última geração.

English

While Neural Machine Translation (NMT) represents the leading approach to Machine Translation (MT), the outputs of NMT models still require translation post-editing to rectify errors and enhance quality, particularly under critical settings. In this work, we formalize the task of translation post-editing with Large Language Models (LLMs) and explore the use of GPT-4 to automatically post-edit NMT outputs across several language pairs. Our results demonstrate that GPT-4 is adept at translation post-editing and produces meaningful edits even when the target language is not English. Notably, we achieve state-of-the-art performance on WMT-22 English-Chinese, English-German, Chinese-English and German-English language pairs using GPT-4 based post-editing, as evaluated by state-of-the-art MT quality metrics.

Aproveitando o GPT-4 para Pós-Edição Automática de Traduções

Leveraging GPT-4 for Automatic Translation Post-Editing

Resumo

Support