ChatPaper.aiChatPaper

EasyEdit2: Ein benutzerfreundliches Steuerungsframework zur Bearbeitung großer Sprachmodelle

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Autoren: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Zusammenfassung

In diesem Artikel stellen wir EasyEdit2 vor, ein Framework, das entwickelt wurde, um eine Plug-and-Play-Anpassbarkeit zur Steuerung des Verhaltens von Large Language Models (LLMs) zu ermöglichen. EasyEdit2 unterstützt eine Vielzahl von Interventionen zur Laufzeit, darunter Sicherheit, Stimmung, Persönlichkeit, Denkmuster, Faktizität und Sprachmerkmale. Im Gegensatz zu seinem Vorgänger verfügt EasyEdit2 über eine neue Architektur, die speziell für die nahtlose Steuerung von Modellen entwickelt wurde. Es umfasst Schlüsselmodule wie den Steuerungsvektorgenerator und den Steuerungsvektoranwender, die die automatische Generierung und Anwendung von Steuerungsvektoren ermöglichen, um das Verhalten des Modells zu beeinflussen, ohne dessen Parameter zu verändern. Einer der Hauptvorteile von EasyEdit2 ist seine Benutzerfreundlichkeit – Benutzer benötigen kein umfangreiches technisches Wissen. Mit nur einem einzigen Beispiel können sie die Antworten des Modells effektiv lenken und anpassen, was eine präzise Steuerung sowohl zugänglich als auch effizient macht. Empirisch berichten wir über die Leistung der Modellsteuerung bei verschiedenen LLMs und demonstrieren die Wirksamkeit dieser Techniken. Wir haben den Quellcode auf GitHub unter https://github.com/zjunlp/EasyEdit zusammen mit einem Demonstrations-Notebook veröffentlicht. Zusätzlich bieten wir ein Demo-Video unter https://zjunlp.github.io/project/EasyEdit2/video für eine schnelle Einführung an.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025