ChatPaper.aiChatPaper

적응형 매칭 증류를 통한 Few-Step 생성 최적화

Optimizing Few-Step Generation with Adaptive Matching Distillation

February 7, 2026
저자: Lichen Bai, Zikai Zhou, Shitong Shao, Wenliang Zhong, Shuo Yang, Shuo Chen, Bojun Chen, Zeke Xie
cs.AI

초록

분포 매칭 증류(DMD)는 강력한 가속 패러다임이지만, 실제 교사가 신뢰할 수 없는 지침을 제공하는 동시에 가짜 교사가 충분한 반발력을 발휘하지 못하는 금지 구역(Forbidden Zone)에서 그 안정성이 종종 저해됩니다. 본 연구에서는 기존 기술을 이러한 오염된 영역을 회피하기 위한 암묵적 전략으로 재해석하는 통합 최적화 프레임워크를 제안합니다. 이러한 통찰을 바탕으로, 보상 프록시를 활용하여 금지 구역을 명시적으로 탐지 및 이탈하는 자가 수정 메커니즘인 적응형 매칭 증류(AMD)를 소개합니다. AMD는 구조적 신호 분해를 통해 수정 그래디언트를 동적으로 우선순위화하고, 반발 경관 샤프닝(Repulsive Landscape Sharpening)을 도입하여 실패 모드 붕괴에 대한 가파른 에너지 장벽을 강화합니다. 이미지 및 비디오 생성 작업(SDXL, Wan2.1 등)과 엄격한 벤치마크(VBench, GenEval 등)에 대한 광범위한 실험을 통해 AMD가 샘플 충실도와 훈련 강건성을 크게 향상시킴을 입증했습니다. 예를 들어, AMD는 SDXL의 HPSv2 점수를 30.64에서 31.25로 향상시켜 최첨단 기준선을 능가합니다. 이러한 결과는 금지 구역 내 최적화 궤적을 명시적으로 수정하는 것이 few-step 생성 모델의 성능 한계를 높이는 데 필수적임을 검증합니다.
English
Distribution Matching Distillation (DMD) is a powerful acceleration paradigm, yet its stability is often compromised in Forbidden Zone, regions where the real teacher provides unreliable guidance while the fake teacher exerts insufficient repulsive force. In this work, we propose a unified optimization framework that reinterprets prior art as implicit strategies to avoid these corrupted regions. Based on this insight, we introduce Adaptive Matching Distillation (AMD), a self-correcting mechanism that utilizes reward proxies to explicitly detect and escape Forbidden Zones. AMD dynamically prioritizes corrective gradients via structural signal decomposition and introduces Repulsive Landscape Sharpening to enforce steep energy barriers against failure mode collapse. Extensive experiments across image and video generation tasks (e.g., SDXL, Wan2.1) and rigorous benchmarks (e.g., VBench, GenEval) demonstrate that AMD significantly enhances sample fidelity and training robustness. For instance, AMD improves the HPSv2 score on SDXL from 30.64 to 31.25, outperforming state-of-the-art baselines. These findings validate that explicitly rectifying optimization trajectories within Forbidden Zones is essential for pushing the performance ceiling of few-step generative models.
PDF92March 28, 2026