Nuove tendenze per la traduzione automatica moderna con modelli di ragionamento su larga scala

Abstract

I recenti progressi nei Modelli di Ragionamento su Grande Scala (Large Reasoning Models, LRMs), in particolare quelli che sfruttano il ragionamento a Catena di Pensiero (Chain-of-Thought, CoT), hanno aperto nuove possibilità per la Traduzione Automatica (Machine Translation, MT). Questo position paper sostiene che gli LRM hanno sostanzialmente trasformato i paradigmi tradizionali della traduzione neurale e quelli basati su Modelli Linguistici di Grande Scala (LLMs), ridefinendo la traduzione come un compito di ragionamento dinamico che richiede comprensione e ragionamento contestuale, culturale e linguistico. Identifichiamo tre cambiamenti fondamentali: 1) coerenza contestuale, dove gli LRM risolvono ambiguità e preservano la struttura del discorso attraverso un ragionamento esplicito su contesti complessi o addirittura assenti; 2) intenzionalità culturale, che consente ai modelli di adattare gli output inferendo l'intento del parlante, le aspettative del pubblico e le norme socio-linguistiche; 3) auto-riflessione, in cui gli LRM possono correggere potenziali errori di traduzione, specialmente in casi estremamente rumorosi, dimostrando una maggiore robustezza rispetto alla semplice mappatura X->Y. Esploriamo vari scenari di traduzione, inclusa la traduzione stilizzata, la traduzione a livello di documento e la traduzione multimodale, mostrando esempi empirici che dimostrano la superiorità degli LRM nella traduzione. Identifichiamo inoltre diversi fenomeni interessanti degli LRM per la MT, come la traduzione auto-pivot, e le sfide critiche, come l'eccessiva localizzazione nella traduzione e l'efficienza nell'inferenza. In conclusione, riteniamo che gli LRM ridefiniscano i sistemi di traduzione non semplicemente come convertitori di testo, ma come agenti cognitivi multilingue capaci di ragionare sul significato oltre il testo. Questo cambio di paradigma ci invita a considerare i problemi della traduzione in un contesto molto più ampio con gli LRM, pensando a ciò che possiamo ottenere oltre i tradizionali scenari di traduzione.

English

Recent advances in Large Reasoning Models (LRMs), particularly those leveraging Chain-of-Thought reasoning (CoT), have opened brand new possibility for Machine Translation (MT). This position paper argues that LRMs substantially transformed traditional neural MT as well as LLMs-based MT paradigms by reframing translation as a dynamic reasoning task that requires contextual, cultural, and linguistic understanding and reasoning. We identify three foundational shifts: 1) contextual coherence, where LRMs resolve ambiguities and preserve discourse structure through explicit reasoning over cross-sentence and complex context or even lack of context; 2) cultural intentionality, enabling models to adapt outputs by inferring speaker intent, audience expectations, and socio-linguistic norms; 3) self-reflection, LRMs can perform self-reflection during the inference time to correct the potential errors in translation especially extremely noisy cases, showing better robustness compared to simply mapping X->Y translation. We explore various scenarios in translation including stylized translation, document-level translation and multimodal translation by showcasing empirical examples that demonstrate the superiority of LRMs in translation. We also identify several interesting phenomenons for LRMs for MT including auto-pivot translation as well as the critical challenges such as over-localisation in translation and inference efficiency. In conclusion, we think that LRMs redefine translation systems not merely as text converters but as multilingual cognitive agents capable of reasoning about meaning beyond the text. This paradigm shift reminds us to think of problems in translation beyond traditional translation scenarios in a much broader context with LRMs - what we can achieve on top of it.

Nuove tendenze per la traduzione automatica moderna con modelli di ragionamento su larga scala

New Trends for Modern Machine Translation with Large Reasoning Models

Abstract

Support