Tstars-Tryon 1.0 : Essayage Virtuel Robuste et Réaliste pour des Articles de Mode Diversifiés
Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items
April 21, 2026
Auteurs: Mengting Chen, Zhengrui Chen, Yongchao Du, Zuan Gao, Taihang Hu, Jinsong Lan, Chao Lin, Yefeng Shen, Xingjian Wang, Zhao Wang, Zhengtao Wu, Xiaoli Xu, Zhengze Xu, Hao Yan, Mingzhou Zhang, Jun Zheng, Qinye Zhou, Xiaoyong Zhu, Bo Zheng
cs.AI
Résumé
Les récentes avancées en génération et édition d'images ont ouvert de nouvelles opportunités pour l'essayage virtuel. Cependant, les méthodes existantes peinent encore à répondre aux demandes complexes du monde réel. Nous présentons Tstars-Tryon 1.0, un système d'essayage virtuel à l'échelle commerciale qui est robuste, réaliste, polyvalent et hautement efficace. Premièrement, notre système maintient un taux de réussite élevé dans des cas difficiles comme les poses extrêmes, les variations d'éclairage sévères, le flou de mouvement et autres conditions en environnement réel. Deuxièmement, il produit des résultats hautement photoréalistes avec des détails fins, préservant fidèlement la texture des vêtements, les propriétés des matériaux et les caractéristiques structurelles, tout en évitant largement les artefacts courants générés par l'IA. Troisièmement, au-delà de l'essayage de vêtements, notre modèle prend en charge une composition flexible multi-images (jusqu'à 6 images de référence) couvrant 8 catégories de mode, avec un contrôle coordonné de l'identité de la personne et de l'arrière-plan. Quatrièmement, pour surmonter les goulots d'étranglement de latence du déploiement commercial, notre système est fortement optimisé pour la vitesse d'inférence, offrant une génération quasi en temps réel pour une expérience utilisateur fluide. Ces capacités sont rendues possibles par une conception système intégrée couvrant l'architecture de modèle end-to-end, un moteur de données évolutif, une infrastructure robuste et un paradigme d'entraînement multi-étapes. Une évaluation approfondie et un déploiement produit à grande échelle démontrent que Tstars-Tryon1.0 atteint des performances globales leaders. Pour soutenir la recherche future, nous publions également un benchmark complet. Le modèle a été déployé à l'échelle industrielle sur l'application Taobao, servant des millions d'utilisateurs avec des dizaines de millions de requêtes.
English
Recent advances in image generation and editing have opened new opportunities for virtual try-on. However, existing methods still struggle to meet complex real-world demands. We present Tstars-Tryon 1.0, a commercial-scale virtual try-on system that is robust, realistic, versatile, and highly efficient. First, our system maintains a high success rate across challenging cases like extreme poses, severe illumination variations, motion blur, and other in-the-wild conditions. Second, it delivers highly photorealistic results with fine-grained details, faithfully preserving garment texture, material properties, and structural characteristics, while largely avoiding common AI-generated artifacts. Third, beyond apparel try-on, our model supports flexible multi-image composition (up to 6 reference images) across 8 fashion categories, with coordinated control over person identity and background. Fourth, to overcome the latency bottlenecks of commercial deployment, our system is heavily optimized for inference speed, delivering near real-time generation for a seamless user experience. These capabilities are enabled by an integrated system design spanning end-to-end model architecture, a scalable data engine, robust infrastructure, and a multi-stage training paradigm. Extensive evaluation and large-scale product deployment demonstrate that Tstars-Tryon1.0 achieves leading overall performance. To support future research, we also release a comprehensive benchmark. The model has been deployed at an industrial scale on the Taobao App, serving millions of users with tens of millions of requests.