ChatPaper.aiChatPaper

Адаптивное управление без классификатора с использованием динамического маскирования низкой уверенности

Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking

May 26, 2025
Авторы: Pengxiang Li, Shilin Yan, Joey Tsai, Renrui Zhang, Ruichuan An, Ziyu Guo, Xiaowei Gao
cs.AI

Аннотация

Classifier-Free Guidance (CFG) значительно повышает управляемость в генеративных моделях за счёт интерполяции условных и безусловных предсказаний. Однако стандартный CFG часто использует статический безусловный вход, что может быть неоптимальным для итеративных процессов генерации, где неопределённость модели изменяется динамически. Мы представляем Adaptive Classifier-Free Guidance (A-CFG) — новый метод, который адаптирует безусловный вход, используя мгновенную уверенность модели в предсказаниях. На каждом шаге итеративной (маскированной) диффузионной языковой модели A-CFG идентифицирует токены в текущей сгенерированной последовательности, для которых модель демонстрирует низкую уверенность. Эти токены временно повторно маскируются для создания динамического, локализованного безусловного входа. Это фокусирует корректирующее влияние CFG именно на области неоднозначности, что приводит к более эффективному управлению. Мы интегрируем A-CFG в современную маскированную диффузионную языковую модель и демонстрируем её эффективность. Эксперименты на различных бенчмарках генерации текста показывают, что A-CFG обеспечивает значительные улучшения по сравнению со стандартным CFG, например, достигая увеличения на 3,9 балла на GPQA. Наша работа подчёркивает преимущество динамической адаптации механизмов управления к неопределённости модели в итеративной генерации.
English
Classifier-Free Guidance (CFG) significantly enhances controllability in generative models by interpolating conditional and unconditional predictions. However, standard CFG often employs a static unconditional input, which can be suboptimal for iterative generation processes where model uncertainty varies dynamically. We introduce Adaptive Classifier-Free Guidance (A-CFG), a novel method that tailors the unconditional input by leveraging the model's instantaneous predictive confidence. At each step of an iterative (masked) diffusion language model, A-CFG identifies tokens in the currently generated sequence for which the model exhibits low confidence. These tokens are temporarily re-masked to create a dynamic, localized unconditional input. This focuses CFG's corrective influence precisely on areas of ambiguity, leading to more effective guidance. We integrate A-CFG into a state-of-the-art masked diffusion language model and demonstrate its efficacy. Experiments on diverse language generation benchmarks show that A-CFG yields substantial improvements over standard CFG, achieving, for instance, a 3.9 point gain on GPQA. Our work highlights the benefit of dynamically adapting guidance mechanisms to model uncertainty in iterative generation.

Summary

AI-Generated Summary

PDF22May 30, 2025