ChatPaper.aiChatPaper

PixelSmile: Auf dem Weg zur feinabgestuften Bearbeitung von Gesichtsausdrücken

PixelSmile: Toward Fine-Grained Facial Expression Editing

March 26, 2026
Autoren: Jiabin Hua, Hengyuan Xu, Aojie Li, Wei Cheng, Gang Yu, Xingjun Ma, Yu-Gang Jiang
cs.AI

Zusammenfassung

Feingranulare Gesichtsausdrucksbearbeitung wurde lange durch intrinsische semantische Überlappungen eingeschränkt. Um dies zu adressieren, konstruieren wir den Flex Facial Expression (FFE)-Datensatz mit kontinuierlichen affektiven Annotationen und etablieren FFE-Bench zur Bewertung von Strukturverwirrung, Bearbeitungsgenauigkeit, linearer Steuerbarkeit sowie dem Kompromiss zwischen Ausdrucksbearbeitung und Identitätserhaltung. Wir präsentieren PixelSmile, ein Diffusionsframework, das Ausdruckssemantik durch vollständig symmetrisches Joint Training entkoppelt. PixelSmile kombiniert Intensitätsüberwachung mit kontrastivem Lernen, um stärkere und besser unterscheidbare Ausdrücke zu erzeugen, und erreicht präzise und stabile lineare Ausdruckskontrolle durch textbasierte latente Interpolation. Umfangreiche Experimente belegen, dass PixelSmile überlegene Entkopplung und robusten Identitätserhalt erreicht, was seine Wirksamkeit für kontinuierliche, steuerbare und feingranulare Ausdrucksbearbeitung bestätigt, während es natürliches sanftes Ausdrucksblending unterstützt.
English
Fine-grained facial expression editing has long been limited by intrinsic semantic overlap. To address this, we construct the Flex Facial Expression (FFE) dataset with continuous affective annotations and establish FFE-Bench to evaluate structural confusion, editing accuracy, linear controllability, and the trade-off between expression editing and identity preservation. We propose PixelSmile, a diffusion framework that disentangles expression semantics via fully symmetric joint training. PixelSmile combines intensity supervision with contrastive learning to produce stronger and more distinguishable expressions, achieving precise and stable linear expression control through textual latent interpolation. Extensive experiments demonstrate that PixelSmile achieves superior disentanglement and robust identity preservation, confirming its effectiveness for continuous, controllable, and fine-grained expression editing, while naturally supporting smooth expression blending.
PDF1113March 29, 2026