Hunyuan3D 2.0: Dimensionamento de Modelos de Difusão para Geração de Ativos 3D Texturizados de Alta Resolução

Resumo

Apresentamos o Hunyuan3D 2.0, um avançado sistema de síntese 3D em larga escala para geração de ativos 3D texturizados de alta resolução. Este sistema inclui dois componentes fundamentais: um modelo de geração de forma em larga escala - Hunyuan3D-DiT, e um modelo de síntese de textura em larga escala - Hunyuan3D-Paint. O modelo generativo de forma, construído em um transformador de difusão baseado em fluxo escalável, tem como objetivo criar geometria que se alinhe adequadamente com uma imagem de condição fornecida, estabelecendo uma base sólida para aplicações posteriores. O modelo de síntese de textura, beneficiando-se de fortes precursores geométricos e de difusão, produz mapas de textura de alta resolução e vibrantes para malhas geradas ou feitas à mão. Além disso, desenvolvemos o Hunyuan3D-Studio - uma plataforma de produção versátil e amigável ao usuário que simplifica o processo de recriação de ativos 3D. Permite que usuários profissionais e amadores manipulem ou até animem suas malhas de forma eficiente. Avaliamos sistematicamente nossos modelos, demonstrando que o Hunyuan3D 2.0 supera os modelos anteriores de última geração, incluindo os modelos de código aberto e de código fechado em detalhes de geometria, alinhamento de condição, qualidade de textura, etc. O Hunyuan3D 2.0 é publicamente lançado para preencher as lacunas na comunidade 3D de código aberto para modelos generativos de fundação em larga escala. O código e os pesos pré-treinados de nossos modelos estão disponíveis em: https://github.com/Tencent/Hunyuan3D-2

English

We present Hunyuan3D 2.0, an advanced large-scale 3D synthesis system for generating high-resolution textured 3D assets. This system includes two foundation components: a large-scale shape generation model -- Hunyuan3D-DiT, and a large-scale texture synthesis model -- Hunyuan3D-Paint. The shape generative model, built on a scalable flow-based diffusion transformer, aims to create geometry that properly aligns with a given condition image, laying a solid foundation for downstream applications. The texture synthesis model, benefiting from strong geometric and diffusion priors, produces high-resolution and vibrant texture maps for either generated or hand-crafted meshes. Furthermore, we build Hunyuan3D-Studio -- a versatile, user-friendly production platform that simplifies the re-creation process of 3D assets. It allows both professional and amateur users to manipulate or even animate their meshes efficiently. We systematically evaluate our models, showing that Hunyuan3D 2.0 outperforms previous state-of-the-art models, including the open-source models and closed-source models in geometry details, condition alignment, texture quality, and etc. Hunyuan3D 2.0 is publicly released in order to fill the gaps in the open-source 3D community for large-scale foundation generative models. The code and pre-trained weights of our models are available at: https://github.com/Tencent/Hunyuan3D-2

Hunyuan3D 2.0: Dimensionamento de Modelos de Difusão para Geração de Ativos 3D Texturizados de Alta Resolução

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

Resumo

Support