ChatPaper.aiChatPaper

EasyEdit2: Un marco de dirección fácil de usar para la edición de modelos de lenguaje grande

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Autores: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Resumen

En este artículo, presentamos EasyEdit2, un marco diseñado para permitir la ajustabilidad plug-and-play en el control del comportamiento de los Modelos de Lenguaje de Gran Escala (LLM, por sus siglas en inglés). EasyEdit2 admite una amplia gama de intervenciones en tiempo de prueba, incluyendo seguridad, sentimiento, personalidad, patrones de razonamiento, factualidad y características del lenguaje. A diferencia de su predecesor, EasyEdit2 cuenta con una nueva arquitectura específicamente diseñada para la dirección fluida del modelo. Esta incluye módulos clave como el generador de vectores de dirección y el aplicador de vectores de dirección, que permiten la generación y aplicación automática de vectores de dirección para influir en el comportamiento del modelo sin modificar sus parámetros. Una de las principales ventajas de EasyEdit2 es su facilidad de uso: los usuarios no necesitan conocimientos técnicos extensos. Con solo un ejemplo, pueden guiar y ajustar eficazmente las respuestas del modelo, haciendo que el control preciso sea accesible y eficiente. Empíricamente, reportamos el rendimiento de la dirección del modelo en diferentes LLM, demostrando la efectividad de estas técnicas. Hemos publicado el código fuente en GitHub en https://github.com/zjunlp/EasyEdit junto con un cuaderno de demostración. Además, proporcionamos un video de demostración en https://zjunlp.github.io/project/EasyEdit2/video para una introducción rápida.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025