PixelSmile: 세밀한 얼굴 표정 편집을 위한 연구

초록

미세한 얼굴 표정 편집은 오랫동안 내재적 의미론적 중첩에 의해 제한되어 왔습니다. 이를 해결하기 위해 우리는 연속적인 정서 주석이 포함된 FFE 데이터셋을 구축하고, 구조적 혼동, 편집 정확도, 선형 제어 가능성, 그리고 표정 편집과 신원 보존 간의 트레이드오프를 평가하기 위한 FFE-Bench를 설립했습니다. 우리는 완전 대칭적 공동 학습을 통해 표정 의미론을 분리하는 확산 프레임워크인 PixelSmile을 제안합니다. PixelSmile은 강도 감독과 대조 학습을 결합하여 더 강력하고 구별 가능한 표정을 생성하며, 텍스트 잠재 공간 보간을 통해 정밀하고 안정적인 선형 표정 제어를 달성합니다. 폭넓은 실험을 통해 PixelSmile이 우수한 분리 성능과 강력한 신원 보존을 달성함으로써 연속적이고 제어 가능하며 미세한 수준의 표정 편집에 효과적임을 확인하였으며, 자연스러운 표정 혼합을 지원합니다.

English

Fine-grained facial expression editing has long been limited by intrinsic semantic overlap. To address this, we construct the Flex Facial Expression (FFE) dataset with continuous affective annotations and establish FFE-Bench to evaluate structural confusion, editing accuracy, linear controllability, and the trade-off between expression editing and identity preservation. We propose PixelSmile, a diffusion framework that disentangles expression semantics via fully symmetric joint training. PixelSmile combines intensity supervision with contrastive learning to produce stronger and more distinguishable expressions, achieving precise and stable linear expression control through textual latent interpolation. Extensive experiments demonstrate that PixelSmile achieves superior disentanglement and robust identity preservation, confirming its effectiveness for continuous, controllable, and fine-grained expression editing, while naturally supporting smooth expression blending.

PixelSmile: 세밀한 얼굴 표정 편집을 위한 연구

PixelSmile: Toward Fine-Grained Facial Expression Editing

초록

Support