OutfitAnyone: Prova Virtual de Ultra-Alta Qualidade para Qualquer Vestuário e Qualquer Pessoa
OutfitAnyone: Ultra-high Quality Virtual Try-On for Any Clothing and Any Person
July 23, 2024
Autores: Ke Sun, Jian Cao, Qi Wang, Linrui Tian, Xindi Zhang, Lian Zhuo, Bang Zhang, Liefeng Bo, Wenbo Zhou, Weiming Zhang, Daiheng Gao
cs.AI
Resumo
A experimentação virtual de roupas (VTON) tornou-se uma tecnologia transformadora, capacitando os usuários a experimentar moda sem precisar experimentar fisicamente as roupas. No entanto, os métodos existentes frequentemente enfrentam dificuldades em gerar resultados de alta fidelidade e consistentes em detalhes. Enquanto os modelos de difusão, como a série Stable Diffusion, demonstraram sua capacidade de criar imagens de alta qualidade e fotorrealistas, eles enfrentam desafios consideráveis em cenários de geração condicional como o VTON. Especificamente, esses modelos têm dificuldade em manter um equilíbrio entre controle e consistência ao gerar imagens para testes de roupas virtuais. O OutfitAnyone aborda essas limitações aproveitando um modelo de difusão condicional de dois fluxos, permitindo lidar habilmente com a deformação de roupas para resultados mais realistas. Ele se destaca com fatores de modulação de escalabilidade, como pose, forma do corpo e ampla aplicabilidade, que se estende de anime a imagens do mundo real. O desempenho do OutfitAnyone em cenários diversos destaca sua utilidade e prontidão para implantação no mundo real. Para mais detalhes e resultados animados, consulte https://humanaigc.github.io/outfit-anyone/.
English
Virtual Try-On (VTON) has become a transformative technology, empowering
users to experiment with fashion without ever having to physically try on
clothing. However, existing methods often struggle with generating
high-fidelity and detail-consistent results. While diffusion models, such as
Stable Diffusion series, have shown their capability in creating high-quality
and photorealistic images, they encounter formidable challenges in conditional
generation scenarios like VTON. Specifically, these models struggle to maintain
a balance between control and consistency when generating images for virtual
clothing trials. OutfitAnyone addresses these limitations by leveraging a
two-stream conditional diffusion model, enabling it to adeptly handle garment
deformation for more lifelike results. It distinguishes itself with
scalability-modulating factors such as pose, body shape and broad
applicability, extending from anime to in-the-wild images. OutfitAnyone's
performance in diverse scenarios underscores its utility and readiness for
real-world deployment. For more details and animated results, please see
https://humanaigc.github.io/outfit-anyone/.Summary
AI-Generated Summary