ChatPaper.aiChatPaper

EasyEdit2: Простая в использовании система управления для редактирования больших языковых моделей

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Авторы: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Аннотация

В данной статье мы представляем EasyEdit2 — фреймворк, разработанный для обеспечения возможности «подключи и работай» в управлении поведением крупных языковых моделей (LLM). EasyEdit2 поддерживает широкий спектр вмешательств на этапе тестирования, включая безопасность, эмоциональную окраску, личностные характеристики, паттерны рассуждений, фактическую точность и языковые особенности. В отличие от своего предшественника, EasyEdit2 обладает новой архитектурой, специально разработанной для плавного управления моделью. Она включает ключевые модули, такие как генератор векторов управления и применитель векторов управления, которые позволяют автоматически генерировать и применять векторы для влияния на поведение модели без изменения её параметров. Одним из главных преимуществ EasyEdit2 является его простота в использовании — пользователям не требуется глубоких технических знаний. Всего один пример позволяет эффективно направлять и корректировать ответы модели, делая точное управление доступным и эффективным. Эмпирически мы демонстрируем результаты управления различными LLM, подтверждая эффективность этих методов. Исходный код доступен на GitHub по адресу https://github.com/zjunlp/EasyEdit вместе с демонстрационным блокнотом. Кроме того, мы предоставляем демонстрационное видео по адресу https://zjunlp.github.io/project/EasyEdit2/video для быстрого ознакомления.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025