ChatPaper.aiChatPaper

EasyEdit2: 대규모 언어 모델 편집을 위한 사용자 친화적 조정 프레임워크

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
저자: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

초록

본 논문에서는 대규모 언어 모델(LLM)의 행동을 제어하기 위한 플러그 앤 플레이 방식의 조정 가능성을 제공하는 프레임워크인 EasyEdit2를 소개합니다. EasyEdit2는 안전성, 감정, 성격, 추론 패턴, 사실성, 언어 특징 등 다양한 테스트 시점 개입을 지원합니다. 이전 버전과 달리, EasyEdit2는 원활한 모델 조종을 위해 특별히 설계된 새로운 아키텍처를 특징으로 합니다. 이 아키텍처는 조종 벡터 생성기와 조종 벡터 적용기와 같은 핵심 모듈로 구성되어 있으며, 이를 통해 모델의 매개변수를 수정하지 않고도 모델의 행동에 영향을 미치는 조종 벡터를 자동으로 생성하고 적용할 수 있습니다. EasyEdit2의 주요 장점 중 하나는 사용의 용이성입니다. 사용자는 광범위한 기술적 지식 없이도 단일 예제만으로 모델의 응답을 효과적으로 안내하고 조정할 수 있어 정밀한 제어가 접근 가능하고 효율적으로 이루어집니다. 실험적으로, 우리는 다양한 LLM에 걸친 모델 조종 성능을 보고하며 이러한 기술의 효과를 입증합니다. 소스 코드는 https://github.com/zjunlp/EasyEdit에서 GitHub에 공개되었으며, 데모 노트북도 함께 제공됩니다. 또한, 빠른 소개를 위한 데모 비디오는 https://zjunlp.github.io/project/EasyEdit2/video에서 확인할 수 있습니다.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025