ChatPaper.aiChatPaper

EasyEdit2: 大規模言語モデル編集のための使いやすい制御フレームワーク

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
著者: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

要旨

本論文では、大規模言語モデル(LLM)の動作を制御するためのプラグアンドプレイ調整を可能にするフレームワーク、EasyEdit2を紹介します。EasyEdit2は、安全性、感情、性格、推論パターン、事実性、言語特性など、幅広いテスト時介入をサポートしています。前身とは異なり、EasyEdit2はシームレスなモデル制御のために特別に設計された新しいアーキテクチャを特徴としています。このアーキテクチャは、モデルのパラメータを変更することなくその動作に影響を与えるための、ステアリングベクトル生成器とステアリングベクトル適用器といった主要モジュールで構成されています。EasyEdit2の主な利点の一つは、その使いやすさにあります。ユーザーは高度な技術的知識を必要とせず、単一の例だけでモデルの応答を効果的に誘導・調整できるため、精密な制御が容易かつ効率的に行えます。実証実験では、さまざまなLLMにおけるモデル制御の性能を報告し、これらの技術の有効性を実証しています。ソースコードはGitHub(https://github.com/zjunlp/EasyEdit)で公開しており、デモンストレーション用のノートブックも提供しています。さらに、簡単な紹介のためのデモ動画をhttps://zjunlp.github.io/project/EasyEdit2/videoで公開しています。
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025