Adaptador Unidimensional para Gobernarlos a Todos: Conceptos, Modelos de Difusión y Aplicaciones de Borrado

Resumen

El uso generalizado de modelos de difusión comerciales y de código abierto (DMs) para la generación de imágenes a partir de texto ha impulsado la necesidad de mitigar riesgos para prevenir comportamientos no deseados. Los métodos existentes en el ámbito académico para la eliminación de conceptos se basan en ajustes finos de parámetros completos o especificaciones, lo que presenta los siguientes problemas: 1) Alteración en la generación hacia la erosión: La deriva de parámetros durante la eliminación del objetivo causa alteraciones y posibles deformaciones en todas las generaciones, incluso erosionando otros conceptos en diversos grados, lo cual es más evidente cuando se eliminan múltiples conceptos; 2) Incapacidad de transferencia e ineficiencia en el despliegue: La eliminación específica del modelo anterior dificulta la combinación flexible de conceptos y la transferencia sin entrenamiento hacia otros modelos, lo que resulta en un crecimiento lineal de costos a medida que aumentan los escenarios de despliegue. Para lograr una eliminación no invasiva, precisa, personalizable y transferible, basamos nuestro marco de eliminación en adaptadores unidimensionales para eliminar múltiples conceptos de la mayoría de los DMs de una vez en diversas aplicaciones de eliminación. La estructura SemiPermeable de concepto se inyecta como una Membrana (SPM) en cualquier DM para aprender la eliminación específica, y al mismo tiempo se mitiga eficazmente el fenómeno de alteración y erosión mediante una novedosa estrategia de ajuste fino de Anclaje Latente. Una vez obtenidas, las SPMs pueden combinarse de manera flexible y utilizarse en otros DMs sin necesidad de un reajuste específico, permitiendo una adaptación rápida y eficiente a diversos escenarios. Durante la generación, nuestro mecanismo de Transporte Facilitado regula dinámicamente la permeabilidad de cada SPM para responder a diferentes indicaciones de entrada, minimizando aún más el impacto en otros conceptos. Los resultados cuantitativos y cualitativos en aproximadamente 40 conceptos, 7 DMs y 4 aplicaciones de eliminación han demostrado la superioridad de las SPMs en la eliminación. Nuestro código y las SPMs preajustadas estarán disponibles en la página del proyecto https://lyumengyao.github.io/projects/spm.

English

The prevalent use of commercial and open-source diffusion models (DMs) for text-to-image generation prompts risk mitigation to prevent undesired behaviors. Existing concept erasing methods in academia are all based on full parameter or specification-based fine-tuning, from which we observe the following issues: 1) Generation alternation towards erosion: Parameter drift during target elimination causes alternations and potential deformations across all generations, even eroding other concepts at varying degrees, which is more evident with multi-concept erased; 2) Transfer inability & deployment inefficiency: Previous model-specific erasure impedes the flexible combination of concepts and the training-free transfer towards other models, resulting in linear cost growth as the deployment scenarios increase. To achieve non-invasive, precise, customizable, and transferable elimination, we ground our erasing framework on one-dimensional adapters to erase multiple concepts from most DMs at once across versatile erasing applications. The concept-SemiPermeable structure is injected as a Membrane (SPM) into any DM to learn targeted erasing, and meantime the alteration and erosion phenomenon is effectively mitigated via a novel Latent Anchoring fine-tuning strategy. Once obtained, SPMs can be flexibly combined and plug-and-play for other DMs without specific re-tuning, enabling timely and efficient adaptation to diverse scenarios. During generation, our Facilitated Transport mechanism dynamically regulates the permeability of each SPM to respond to different input prompts, further minimizing the impact on other concepts. Quantitative and qualitative results across ~40 concepts, 7 DMs and 4 erasing applications have demonstrated the superior erasing of SPM. Our code and pre-tuned SPMs will be available on the project page https://lyumengyao.github.io/projects/spm.

Adaptador Unidimensional para Gobernarlos a Todos: Conceptos, Modelos de Difusión y Aplicaciones de Borrado

One-dimensional Adapter to Rule Them All: Concepts, Diffusion Models and Erasing Applications

Resumen

Support