ChatPaper.aiChatPaper

EasyEdit2: Uma Estrutura de Direcionamento Fácil de Usar para Edição de Modelos de Linguagem de Grande Escala

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Autores: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Resumo

Neste artigo, apresentamos o EasyEdit2, um framework projetado para permitir ajustabilidade plug-and-play no controle de comportamentos de Modelos de Linguagem de Grande Escala (LLMs). O EasyEdit2 suporta uma ampla gama de intervenções em tempo de teste, incluindo segurança, sentimento, personalidade, padrões de raciocínio, factualidade e características de linguagem. Diferente de seu predecessor, o EasyEdit2 apresenta uma nova arquitetura especificamente projetada para direcionamento contínuo e suave do modelo. Ele compreende módulos-chave, como o gerador de vetores de direcionamento e o aplicador de vetores de direcionamento, que permitem a geração e aplicação automática de vetores de direcionamento para influenciar o comportamento do modelo sem modificar seus parâmetros. Uma das principais vantagens do EasyEdit2 é sua facilidade de uso — os usuários não precisam de conhecimento técnico extensivo. Com apenas um único exemplo, eles podem guiar e ajustar efetivamente as respostas do modelo, tornando o controle preciso acessível e eficiente. Empiricamente, relatamos o desempenho de direcionamento do modelo em diferentes LLMs, demonstrando a eficácia dessas técnicas. Disponibilizamos o código-fonte no GitHub em https://github.com/zjunlp/EasyEdit, juntamente com um notebook de demonstração. Além disso, fornecemos um vídeo de demonstração em https://zjunlp.github.io/project/EasyEdit2/video para uma introdução rápida.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025