ChatPaper.aiChatPaper

Mengsel van Stijlexperts voor Diverse Beeldstilisering

Mixture of Style Experts for Diverse Image Stylization

March 17, 2026
Auteurs: Shihao Zhu, Ziheng Ouyang, Yijia Kang, Qilong Wang, Mi Zhou, Bo Li, Ming-Ming Cheng, Qibin Hou
cs.AI

Samenvatting

Diffusiegebaseerde stylisering heeft aanzienlijke vooruitgang geboekt, maar bestaande methoden zijn beperkt tot kleurgedreven transformaties en verwaarlozen complexe semantiek en materiaaldetails. Wij introduceren StyleExpert, een semantisch-bewust kader gebaseerd op Mixture of Experts (MoE). Ons raamwerk gebruikt een uniforme stijl-encoder, getraind op onze grootschalige dataset van inhoud-stijl-gestileerde tripletten, om diverse stijlen in te bedden in een consistente latente ruimte. Deze inbedding wordt vervolgens gebruikt om een gelijkvormigheidsbewust gating-mechanisme te conditioneren, dat stijlen dynamisch doorstuurt naar gespecialiseerde experts binnen de MoE-architectuur. Door gebruik te maken van deze MoE-architectuur, kan onze methode diverse stijlen aan die zich uitstrekken over meerdere semantische niveaus, van oppervlakkige texturen tot diepe semantiek. Uitgebreide experimenten tonen aan dat StyleExpert bestaande benaderingen overtreft in het behouden van semantiek en materiaaldetails, terwijl het generaliseert naar onbekende stijlen. Onze code en verzamelde afbeeldingen zijn beschikbaar op de projectpagina: https://hh-lg.github.io/StyleExpert-Page/.
English
Diffusion-based stylization has advanced significantly, yet existing methods are limited to color-driven transformations, neglecting complex semantics and material details.We introduce StyleExpert, a semantic-aware framework based on the Mixture of Experts (MoE). Our framework employs a unified style encoder, trained on our large-scale dataset of content-style-stylized triplets, to embed diverse styles into a consistent latent space. This embedding is then used to condition a similarity-aware gating mechanism, which dynamically routes styles to specialized experts within the MoE architecture. Leveraging this MoE architecture, our method adeptly handles diverse styles spanning multiple semantic levels, from shallow textures to deep semantics. Extensive experiments show that StyleExpert outperforms existing approaches in preserving semantics and material details, while generalizing to unseen styles. Our code and collected images are available at the project page: https://hh-lg.github.io/StyleExpert-Page/.
PDF22March 19, 2026