ChatPaper.aiChatPaper

PixelSmile: Verso un Editing Sottile delle Espressioni Facciali

PixelSmile: Toward Fine-Grained Facial Expression Editing

March 26, 2026
Autori: Jiabin Hua, Hengyuan Xu, Aojie Li, Wei Cheng, Gang Yu, Xingjun Ma, Yu-Gang Jiang
cs.AI

Abstract

La modifica fine delle espressioni facciali è stata a lungo limitata dalla sovrapposizione semantica intrinseca. Per affrontare questo problema, abbiamo costruito il dataset FFE (Flex Facial Expression) con annotazioni affettive continue e abbiamo istituito FFE-Bench per valutare la confusione strutturale, l'accuratezza della modifica, la controllabilità lineare e il compromesso tra modifica dell'espressione e preservazione dell'identità. Proponiamo PixelSmile, un framework basato su modelli di diffusione che separa la semantica delle espressioni attraverso un addestramento congiunto completamente simmetrico. PixelSmile combina la supervisione dell'intensità con l'apprendimento contrastivo per produrre espressioni più marcate e distinguibili, raggiungendo un controllo lineare preciso e stabile dell'espressione attraverso l'interpolazione latente testuale. Esperimenti estensivi dimostrano che PixelSmile ottiene una superiore separazione semantica e una robusta preservazione dell'identità, confermandone l'efficacia per la modifica continua, controllabile e fine delle espressioni, supportando naturalmente la fusione fluida delle espressioni.
English
Fine-grained facial expression editing has long been limited by intrinsic semantic overlap. To address this, we construct the Flex Facial Expression (FFE) dataset with continuous affective annotations and establish FFE-Bench to evaluate structural confusion, editing accuracy, linear controllability, and the trade-off between expression editing and identity preservation. We propose PixelSmile, a diffusion framework that disentangles expression semantics via fully symmetric joint training. PixelSmile combines intensity supervision with contrastive learning to produce stronger and more distinguishable expressions, achieving precise and stable linear expression control through textual latent interpolation. Extensive experiments demonstrate that PixelSmile achieves superior disentanglement and robust identity preservation, confirming its effectiveness for continuous, controllable, and fine-grained expression editing, while naturally supporting smooth expression blending.
PDF1113March 29, 2026