Miscela di Esperti di Stile per una Stilizzazione d'Immagine Diversificata
Mixture of Style Experts for Diverse Image Stylization
March 17, 2026
Autori: Shihao Zhu, Ziheng Ouyang, Yijia Kang, Qilong Wang, Mi Zhou, Bo Li, Ming-Ming Cheng, Qibin Hou
cs.AI
Abstract
La stilizzazione basata su diffusione ha compiuto progressi significativi, tuttavia i metodi esistenti sono limitati a trasformazioni guidate dal colore, trascurando la semantica complessa e i dettagli materiali. Introduciamo StyleExpert, un framework semantico-aware basato sulla Miscela di Esperti (MoE). Il nostro framework impiega un codificatore di stile unificato, addestrato sul nostro dataset su larga scala di triplette contenuto-stile-stilizzato, per incorporare stili diversi in uno spazio latente consistente. Questo incorporamento viene poi utilizzato per condizionare un meccanismo di gating similarity-aware, che instrada dinamicamente gli stili verso esperti specializzati all'interno dell'architettura MoE. Sfruttando questa architettura MoE, il nostro metodo gestisce con abilità stili diversificati che spaziano su molteplici livelli semantici, dalle texture superficiali alla semantica profonda. Esperimenti estensivi dimostrano che StyleExpert supera gli approcci esistenti nella preservazione della semantica e dei dettagli materiali, generalizzando al contempo verso stili non visti. Il nostro codice e le immagini raccolte sono disponibili alla pagina del progetto: https://hh-lg.github.io/StyleExpert-Page/.
English
Diffusion-based stylization has advanced significantly, yet existing methods are limited to color-driven transformations, neglecting complex semantics and material details.We introduce StyleExpert, a semantic-aware framework based on the Mixture of Experts (MoE). Our framework employs a unified style encoder, trained on our large-scale dataset of content-style-stylized triplets, to embed diverse styles into a consistent latent space. This embedding is then used to condition a similarity-aware gating mechanism, which dynamically routes styles to specialized experts within the MoE architecture. Leveraging this MoE architecture, our method adeptly handles diverse styles spanning multiple semantic levels, from shallow textures to deep semantics. Extensive experiments show that StyleExpert outperforms existing approaches in preserving semantics and material details, while generalizing to unseen styles. Our code and collected images are available at the project page: https://hh-lg.github.io/StyleExpert-Page/.