EasyEdit2: Un framework di controllo facile da usare per la modifica di modelli linguistici di grandi dimensioni
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models
April 21, 2025
Autori: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI
Abstract
In questo articolo, presentiamo EasyEdit2, un framework progettato per abilitare la regolazione plug-and-play del comportamento dei Large Language Model (LLM). EasyEdit2 supporta un'ampia gamma di interventi in fase di test, tra cui sicurezza, sentiment, personalità, schemi di ragionamento, veridicità e caratteristiche linguistiche. A differenza del suo predecessore, EasyEdit2 presenta una nuova architettura specificamente progettata per il controllo fluido del modello. Comprende moduli chiave come il generatore di vettori di controllo e l'applicatore di vettori di controllo, che consentono la generazione e l'applicazione automatica di vettori di controllo per influenzare il comportamento del modello senza modificarne i parametri. Uno dei principali vantaggi di EasyEdit2 è la sua facilità d'uso: gli utenti non necessitano di conoscenze tecniche approfondite. Con un solo esempio, possono guidare e regolare efficacemente le risposte del modello, rendendo il controllo preciso sia accessibile che efficiente. Empiricamente, riportiamo le prestazioni di controllo del modello su diversi LLM, dimostrando l'efficacia di queste tecniche. Abbiamo rilasciato il codice sorgente su GitHub all'indirizzo https://github.com/zjunlp/EasyEdit insieme a un notebook dimostrativo. Inoltre, forniamo un video dimostrativo all'indirizzo https://zjunlp.github.io/project/EasyEdit2/video per una rapida introduzione.
English
In this paper, we introduce EasyEdit2, a framework designed to enable
plug-and-play adjustability for controlling Large Language Model (LLM)
behaviors. EasyEdit2 supports a wide range of test-time interventions,
including safety, sentiment, personality, reasoning patterns, factuality, and
language features. Unlike its predecessor, EasyEdit2 features a new
architecture specifically designed for seamless model steering. It comprises
key modules such as the steering vector generator and the steering vector
applier, which enable automatic generation and application of steering vectors
to influence the model's behavior without modifying its parameters. One of the
main advantages of EasyEdit2 is its ease of use-users do not need extensive
technical knowledge. With just a single example, they can effectively guide and
adjust the model's responses, making precise control both accessible and
efficient. Empirically, we report model steering performance across different
LLMs, demonstrating the effectiveness of these techniques. We have released the
source code on GitHub at https://github.com/zjunlp/EasyEdit along with a
demonstration notebook. In addition, we provide a demo video at
https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.Summary
AI-Generated Summary