Pilotage des grands modèles de langage pour la personnalisation de la traduction automatique

papers.abstract

Les systèmes de traduction automatique de haute qualité basés sur des modèles de langage de grande taille (LLMs) ont simplifié la production de traductions personnalisées reflétant des contraintes stylistiques spécifiques. Cependant, ces systèmes rencontrent encore des difficultés dans des contextes où les exigences stylistiques sont moins explicites et pourraient être plus difficiles à transmettre via des prompts. Nous explorons diverses stratégies pour personnaliser les traductions générées par des LLMs dans des contextes à faibles ressources, en nous concentrant sur le domaine complexe de la traduction littéraire. Nous examinons des stratégies de prompting et des interventions au moment de l'inférence pour orienter les générations du modèle vers un style personnalisé, et proposons un cadre contrastif exploitant des concepts latents extraits d'autoencodeurs parcimonieux pour identifier des propriétés de personnalisation saillantes. Nos résultats montrent que l'orientation permet une forte personnalisation tout en préservant la qualité de la traduction. Nous examinons également l'impact de l'orientation sur les représentations des LLMs, constatant que les couches du modèle ayant un impact pertinent pour la personnalisation sont affectées de manière similaire par le prompting multi-shot et notre méthode d'orientation, suggérant des mécanismes similaires en jeu.

English

High-quality machine translation systems based on large language models (LLMs) have simplified the production of personalized translations reflecting specific stylistic constraints. However, these systems still struggle in settings where stylistic requirements are less explicit and might be harder to convey via prompting. We explore various strategies for personalizing LLM-generated translations in low-resource settings, focusing on the challenging literary translation domain. We explore prompting strategies and inference-time interventions for steering model generations towards a personalized style, and propose a contrastive framework exploiting latent concepts extracted from sparse autoencoders to identify salient personalization properties. Our results show that steering achieves strong personalization while preserving translation quality. We further examine the impact of steering on LLM representations, finding model layers with a relevant impact for personalization are impacted similarly by multi-shot prompting and our steering method, suggesting similar mechanism at play.

Pilotage des grands modèles de langage pour la personnalisation de la traduction automatique

Steering Large Language Models for Machine Translation Personalization

papers.abstract

Support