Tstars-Tryon 1.0: Un Sistema di Virtual Try-On Robusto e Realistico per Articoli di Moda Diversificati
Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items
April 21, 2026
Autori: Mengting Chen, Zhengrui Chen, Yongchao Du, Zuan Gao, Taihang Hu, Jinsong Lan, Chao Lin, Yefeng Shen, Xingjian Wang, Zhao Wang, Zhengtao Wu, Xiaoli Xu, Zhengze Xu, Hao Yan, Mingzhou Zhang, Jun Zheng, Qinye Zhou, Xiaoyong Zhu, Bo Zheng
cs.AI
Abstract
I recenti progressi nella generazione e modifica di immagini hanno aperto nuove opportunità per il virtual try-on. Tuttavia, i metodi esistenti faticano ancora a soddisfare le complesse esigenze del mondo reale. Presentiamo Tstars-Tryon 1.0, un sistema di virtual try-on su scala commerciale che è robusto, realistico, versatile e altamente efficiente. In primo luogo, il nostro sistema mantiene un alto tasso di successo in casi complessi come pose estreme, forti variazioni di illuminazione, motion blur e altre condizioni in-the-wild. In secondo luogo, produce risultati altamente fotorealistici con dettagli granulari, preservando fedelmente la texture dell'indumento, le proprietà del materiale e le caratteristiche strutturali, evitando in larga misura i comuni artefatti generati dall'IA. In terzo luogo, oltre al try-on di abbigliamento, il nostro modello supporta una composizione flessibile multi-immagine (fino a 6 immagini di riferimento) in 8 categorie di moda, con un controllo coordinato sull'identità della persona e sullo sfondo. In quarto luogo, per superare i colli di bottiglia della latenza nella distribuzione commerciale, il nostro sistema è fortemente ottimizzato per la velocità di inferenza, offrendo una generazione quasi in tempo reale per un'esperienza utente senza interruzioni. Queste capacità sono rese possibili da un design di sistema integrato che comprende un'architettura di modello end-to-end, un motore di dati scalabile, un'infrastruttura robusta e un paradigma di addestramento multi-stadio. Valutazioni estensive e una distribuzione di prodotto su larga scala dimostrano che Tstars-Tryon 1.0 raggiunge prestazioni complessive all'avanguardia. Per supportare la ricerca futura, rilasciamo anche un benchmark completo. Il modello è stato distribuito su scala industriale sull'App Taobao, servendo milioni di utenti con decine di milioni di richieste.
English
Recent advances in image generation and editing have opened new opportunities for virtual try-on. However, existing methods still struggle to meet complex real-world demands. We present Tstars-Tryon 1.0, a commercial-scale virtual try-on system that is robust, realistic, versatile, and highly efficient. First, our system maintains a high success rate across challenging cases like extreme poses, severe illumination variations, motion blur, and other in-the-wild conditions. Second, it delivers highly photorealistic results with fine-grained details, faithfully preserving garment texture, material properties, and structural characteristics, while largely avoiding common AI-generated artifacts. Third, beyond apparel try-on, our model supports flexible multi-image composition (up to 6 reference images) across 8 fashion categories, with coordinated control over person identity and background. Fourth, to overcome the latency bottlenecks of commercial deployment, our system is heavily optimized for inference speed, delivering near real-time generation for a seamless user experience. These capabilities are enabled by an integrated system design spanning end-to-end model architecture, a scalable data engine, robust infrastructure, and a multi-stage training paradigm. Extensive evaluation and large-scale product deployment demonstrate that Tstars-Tryon1.0 achieves leading overall performance. To support future research, we also release a comprehensive benchmark. The model has been deployed at an industrial scale on the Taobao App, serving millions of users with tens of millions of requests.