PixelSmile : Vers un édition fine des expressions faciales
PixelSmile: Toward Fine-Grained Facial Expression Editing
March 26, 2026
Auteurs: Jiabin Hua, Hengyuan Xu, Aojie Li, Wei Cheng, Gang Yu, Xingjun Ma, Yu-Gang Jiang
cs.AI
Résumé
L'édition fine des expressions faciales a longtemps été limitée par le chevauchement sémantique intrinsèque. Pour y remédier, nous avons constitué le jeu de données Flex Facial Expression (FFE) avec des annotations affectives continues et établi FFE-Bench pour évaluer la confusion structurelle, la précision de l'édition, la contrôlabilité linéaire et le compromis entre édition des expressions et préservation de l'identité. Nous proposons PixelSmile, un framework à diffusion qui dissocie la sémantique des expressions via un entraînement conjoint entièrement symétrique. PixelSmile combine la supervision de l'intensité avec l'apprentissage contrastif pour produire des expressions plus marquées et distinctives, atteignant un contrôle linéaire précis et stable grâce à l'interpolation latente textuelle. Des expériences approfondies démontrent que PixelSmile obtient une dissociation supérieure et une préservation robuste de l'identité, confirmant son efficacité pour l'édition continue, contrôlable et granulaire des expressions, tout en supportant naturellement le mélange fluide des expressions.
English
Fine-grained facial expression editing has long been limited by intrinsic semantic overlap. To address this, we construct the Flex Facial Expression (FFE) dataset with continuous affective annotations and establish FFE-Bench to evaluate structural confusion, editing accuracy, linear controllability, and the trade-off between expression editing and identity preservation. We propose PixelSmile, a diffusion framework that disentangles expression semantics via fully symmetric joint training. PixelSmile combines intensity supervision with contrastive learning to produce stronger and more distinguishable expressions, achieving precise and stable linear expression control through textual latent interpolation. Extensive experiments demonstrate that PixelSmile achieves superior disentanglement and robust identity preservation, confirming its effectiveness for continuous, controllable, and fine-grained expression editing, while naturally supporting smooth expression blending.