Tstars-Tryon 1.0: Robuste und realistische virtuelle Anprobe für diverse Modeartikel
Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items
April 21, 2026
Autoren: Mengting Chen, Zhengrui Chen, Yongchao Du, Zuan Gao, Taihang Hu, Jinsong Lan, Chao Lin, Yefeng Shen, Xingjian Wang, Zhao Wang, Zhengtao Wu, Xiaoli Xu, Zhengze Xu, Hao Yan, Mingzhou Zhang, Jun Zheng, Qinye Zhou, Xiaoyong Zhu, Bo Zheng
cs.AI
Zusammenfassung
Jüngste Fortschritte in der Bildgenerierung und -bearbeitung haben neue Möglichkeiten für virtuelles Anprobieren eröffnet. Allerdings haben bestehende Methoden nach wie vor Schwierigkeiten, komplexen Anforderungen der realen Welt gerecht zu werden. Wir stellen Tstars-Tryon 1.0 vor, ein virtual-try-on-System in kommerziellem Maßstab, das robust, realistisch, vielseitig und hocheffizient ist. Erstens weist unser System eine hohe Erfolgsquote bei anspruchsvollen Fällen auf, wie extremen Posen, starken Beleuchtungsvariationen, Bewegungsunschärfe und anderen unkontrollierten Bedingungen. Zweitens liefert es hochgradig fotorealistische Ergebnisse mit fein granulierten Details, die die Textur, Materialeigenschaften und strukturellen Merkmale der Kleidungsstücke originalgetreu bewahren und gleichzeitig häufige KI-generierte Artefakte weitgehend vermeiden. Drittens unterstützt unser Modell über Kleidungsstücke hinaus eine flexible Multi-Bild-Komposition (bis zu 6 Referenzbilder) über 8 Modekategorien hinweg mit koordinierter Kontrolle von Personenidentität und Hintergrund. Viertens ist unser System zur Überwindung von Latenzengpässen bei kommerziellem Einsatz stark auf Inferenzgeschwindigkeit optimiert und ermöglicht eine nahezu Echtzeit-Generierung für eine nahtlose Benutzererfahrung. Diese Fähigkeiten werden durch ein integriertes Systemdesign ermöglicht, das eine End-to-End-Modellarchitektur, eine skalierbare Daten-Engine, eine robuste Infrastruktur und ein mehrstufiges Trainingsparadigma umfasst. Umfangreiche Evaluierungen und der großflächige Produktiveinsatz demonstrieren, dass Tstars-Tryon 1.0 eine führende Gesamtleistung erzielt. Zur Unterstützung zukünftiger Forschung veröffentlichen wir zudem einen umfassenden Benchmark. Das Modell wurde im industriellen Maßstab in der Taobao-App eingesetzt und bedient Millionen von Nutzern mit zig Millionen Anfragen.
English
Recent advances in image generation and editing have opened new opportunities for virtual try-on. However, existing methods still struggle to meet complex real-world demands. We present Tstars-Tryon 1.0, a commercial-scale virtual try-on system that is robust, realistic, versatile, and highly efficient. First, our system maintains a high success rate across challenging cases like extreme poses, severe illumination variations, motion blur, and other in-the-wild conditions. Second, it delivers highly photorealistic results with fine-grained details, faithfully preserving garment texture, material properties, and structural characteristics, while largely avoiding common AI-generated artifacts. Third, beyond apparel try-on, our model supports flexible multi-image composition (up to 6 reference images) across 8 fashion categories, with coordinated control over person identity and background. Fourth, to overcome the latency bottlenecks of commercial deployment, our system is heavily optimized for inference speed, delivering near real-time generation for a seamless user experience. These capabilities are enabled by an integrated system design spanning end-to-end model architecture, a scalable data engine, robust infrastructure, and a multi-stage training paradigm. Extensive evaluation and large-scale product deployment demonstrate that Tstars-Tryon1.0 achieves leading overall performance. To support future research, we also release a comprehensive benchmark. The model has been deployed at an industrial scale on the Taobao App, serving millions of users with tens of millions of requests.