ChatPaper.aiChatPaper

Tstars-Tryon 1.0: 다양한 패션 아이템을 위한 강건하고 현실적인 가상 피팅

Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

April 21, 2026
저자: Mengting Chen, Zhengrui Chen, Yongchao Du, Zuan Gao, Taihang Hu, Jinsong Lan, Chao Lin, Yefeng Shen, Xingjian Wang, Zhao Wang, Zhengtao Wu, Xiaoli Xu, Zhengze Xu, Hao Yan, Mingzhou Zhang, Jun Zheng, Qinye Zhou, Xiaoyong Zhu, Bo Zheng
cs.AI

초록

최근 이미지 생성 및 편집 기술의 발전으로 가상 피팅 분야에 새로운 기회가 열렸습니다. 그러나 기존 방법론들은 여전히 복잡한 현실 세계의 수요를 충족시키는 데 어려움을 겪고 있습니다. 본 논문은 강건성, 현실성, 다양성, 높은 효율성을 갖춘 상용 규모의 가상 피팅 시스템인 Tstars-Tryon 1.0을 소개합니다. 첫째, 본 시스템은 극단적인 자세, 심한 조명 변화, 모션 블러 등 다양한 실제 환경에서도 높은 성공률을 유지합니다. 둘째, 의상의 텍스처, 재질 특성, 구조적 특성을 충실히 보존하면서 일반적인 AI 생성 아티팩트를 크게 피한 정교한 디테일의 고품질 사실적 결과를 제공합니다. 셋째, 의류 피팅을 넘어 8개의 패션 카테고리에서 최대 6개의 참조 이미지를 활용한 유연한 다중 이미지 합성을 지원하며, 사용자 신원과 배경을 조화롭게 제어합니다. 넷째, 상용 배포의 지연 시간 병목 현상을 극복하기 위해 추론 속도를 중점적으로 최적화하여 원활한 사용자 경험을 위한 준실시간 생성을 가능하게 합니다. 이러한 기능은 종단간 모델 아키텍처, 확장 가능한 데이터 엔진, 강건한 인프라, 다단계 학습 패러다임을 아우르는 통합 시스템 설계를 통해 구현되었습니다. 광범위한 평가와 대규모 제품 배포를 통해 Tstars-Tryon 1.0이 전반적으로 선도적인 성능을 달성함을 입증하였습니다. 향후 연구를 지원하기 위해 포괄적인 벤치마크도 공개합니다. 본 모델은 타오바오 앱에서 산업 규모로 배포되어 수백만 명의 사용자에게 수천만 건의 요청을 처리하며 서비스되고 있습니다.
English
Recent advances in image generation and editing have opened new opportunities for virtual try-on. However, existing methods still struggle to meet complex real-world demands. We present Tstars-Tryon 1.0, a commercial-scale virtual try-on system that is robust, realistic, versatile, and highly efficient. First, our system maintains a high success rate across challenging cases like extreme poses, severe illumination variations, motion blur, and other in-the-wild conditions. Second, it delivers highly photorealistic results with fine-grained details, faithfully preserving garment texture, material properties, and structural characteristics, while largely avoiding common AI-generated artifacts. Third, beyond apparel try-on, our model supports flexible multi-image composition (up to 6 reference images) across 8 fashion categories, with coordinated control over person identity and background. Fourth, to overcome the latency bottlenecks of commercial deployment, our system is heavily optimized for inference speed, delivering near real-time generation for a seamless user experience. These capabilities are enabled by an integrated system design spanning end-to-end model architecture, a scalable data engine, robust infrastructure, and a multi-stage training paradigm. Extensive evaluation and large-scale product deployment demonstrate that Tstars-Tryon1.0 achieves leading overall performance. To support future research, we also release a comprehensive benchmark. The model has been deployed at an industrial scale on the Taobao App, serving millions of users with tens of millions of requests.
PDF796April 23, 2026