Chirurgia Linguistica nei Modelli Linguistici Multilingue di Grande Dimensione

Abstract

I Large Language Model (LLM) hanno dimostrato notevoli capacità di generalizzazione attraverso compiti e lingue, rivoluzionando l'elaborazione del linguaggio naturale. Questo articolo indaga l'allineamento delle rappresentazioni che emerge naturalmente nei LLM, in particolare negli strati intermedi, e le sue implicazioni per la separazione delle informazioni specifiche della lingua e indipendenti dalla lingua. Confermiamo empiricamente l'esistenza di questo allineamento, analizziamo il suo comportamento rispetto a modelli di allineamento progettati esplicitamente e dimostriamo il suo potenziale per la manipolazione specifica della lingua senza degradazione semantica. Basandoci su questi risultati, proponiamo Inference-Time Language Control (ITLC), un metodo innovativo che sfrutta l'iniezione latente per abilitare un controllo linguistico cross-linguale preciso e mitigare la confusione linguistica nei LLM. I nostri esperimenti evidenziano le forti capacità di controllo cross-linguale di ITLC preservando l'integrità semantica nelle lingue target. Inoltre, dimostriamo la sua efficacia nell'alleviare il problema della confusione linguistica cross-linguale, che persiste anche negli attuali LLM su larga scala, portando a una generazione linguistica incoerente. Questo lavoro avanza la nostra comprensione dell'allineamento delle rappresentazioni nei LLM e introduce una soluzione pratica per migliorare le loro prestazioni cross-linguali.

English

Large Language Models (LLMs) have demonstrated remarkable generalization capabilities across tasks and languages, revolutionizing natural language processing. This paper investigates the naturally emerging representation alignment in LLMs, particularly in the middle layers, and its implications for disentangling language-specific and language-agnostic information. We empirically confirm the existence of this alignment, analyze its behavior in comparison to explicitly designed alignment models, and demonstrate its potential for language-specific manipulation without semantic degradation. Building on these findings, we propose Inference-Time Language Control (ITLC), a novel method that leverages latent injection to enable precise cross-lingual language control and mitigate language confusion in LLMs. Our experiments highlight ITLC's strong cross-lingual control capabilities while preserving semantic integrity in target languages. Furthermore, we demonstrate its effectiveness in alleviating the cross-lingual language confusion problem, which persists even in current large-scale LLMs, leading to inconsistent language generation. This work advances our understanding of representation alignment in LLMs and introduces a practical solution for enhancing their cross-lingual performance.

Chirurgia Linguistica nei Modelli Linguistici Multilingue di Grande Dimensione

Language Surgery in Multilingual Large Language Models

Abstract

Support