ChatPaper.aiChatPaper

TAG: Guía de Amplificación Tangencial para el Muestreo de Difusión Resistente a Alucinaciones

TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling

October 6, 2025
Autores: Hyunmin Cho, Donghoon Ahn, Susung Hong, Jee Eun Kim, Seungryong Kim, Kyong Hwan Jin
cs.AI

Resumen

Los modelos de difusión recientes logran un rendimiento de vanguardia en la generación de imágenes, pero a menudo sufren de inconsistencias semánticas o alucinaciones. Si bien diversos métodos de guía en tiempo de inferencia pueden mejorar la generación, suelen operar de manera indirecta al depender de señales externas o modificaciones arquitectónicas, lo que introduce una sobrecarga computacional adicional. En este artículo, proponemos la Guía de Amplificación Tangencial (TAG, por sus siglas en inglés), un método de guía más eficiente y directo que opera únicamente sobre señales de trayectoria sin modificar el modelo de difusión subyacente. TAG aprovecha una muestra intermedia como base de proyección y amplifica los componentes tangenciales de los puntajes estimados con respecto a esta base para corregir la trayectoria de muestreo. Formalizamos este proceso de guía mediante una expansión de Taylor de primer orden, lo que demuestra que la amplificación del componente tangencial dirige el estado hacia regiones de mayor probabilidad, reduciendo así las inconsistencias y mejorando la calidad de las muestras. TAG es un módulo plug-and-play, independiente de la arquitectura, que mejora la fidelidad del muestreo por difusión con una adición computacional mínima, ofreciendo una nueva perspectiva sobre la guía en modelos de difusión.
English
Recent diffusion models achieve the state-of-the-art performance in image generation, but often suffer from semantic inconsistencies or hallucinations. While various inference-time guidance methods can enhance generation, they often operate indirectly by relying on external signals or architectural modifications, which introduces additional computational overhead. In this paper, we propose Tangential Amplifying Guidance (TAG), a more efficient and direct guidance method that operates solely on trajectory signals without modifying the underlying diffusion model. TAG leverages an intermediate sample as a projection basis and amplifies the tangential components of the estimated scores with respect to this basis to correct the sampling trajectory. We formalize this guidance process by leveraging a first-order Taylor expansion, which demonstrates that amplifying the tangential component steers the state toward higher-probability regions, thereby reducing inconsistencies and enhancing sample quality. TAG is a plug-and-play, architecture-agnostic module that improves diffusion sampling fidelity with minimal computational addition, offering a new perspective on diffusion guidance.
PDF475October 13, 2025