ChatPaper.aiChatPaper

EasyEdit2 : Un cadre de pilotage facile à utiliser pour la modification des grands modèles de langage

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Auteurs: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Résumé

Dans cet article, nous présentons EasyEdit2, un cadre conçu pour permettre une ajustabilité plug-and-play afin de contrôler les comportements des modèles de langage de grande taille (LLM). EasyEdit2 prend en charge un large éventail d'interventions en temps de test, incluant la sécurité, le sentiment, la personnalité, les schémas de raisonnement, la factualité et les caractéristiques linguistiques. Contrairement à son prédécesseur, EasyEdit2 intègre une nouvelle architecture spécifiquement conçue pour un pilotage fluide des modèles. Il comprend des modules clés tels que le générateur de vecteurs de pilotage et l'applicateur de vecteurs de pilotage, qui permettent la génération et l'application automatiques de vecteurs de pilotage pour influencer le comportement du modèle sans modifier ses paramètres. L'un des principaux avantages d'EasyEdit2 est sa facilité d'utilisation : les utilisateurs n'ont pas besoin de connaissances techniques approfondies. Avec un seul exemple, ils peuvent guider et ajuster efficacement les réponses du modèle, rendant le contrôle précis à la fois accessible et efficace. Empiriquement, nous rapportons les performances de pilotage du modèle sur différents LLM, démontrant l'efficacité de ces techniques. Nous avons publié le code source sur GitHub à l'adresse https://github.com/zjunlp/EasyEdit ainsi qu'un notebook de démonstration. De plus, nous fournissons une vidéo de démonstration à l'adresse https://zjunlp.github.io/project/EasyEdit2/video pour une introduction rapide.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025