Hunyuan-Game: Modelo Industrial de Criação de Jogos Inteligentes
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model
May 20, 2025
Autores: Ruihuang Li, Caijin Zhou, Shoujian Zheng, Jianxiang Lu, Jiabin Huang, Comi Chen, Junshu Tang, Guangzheng Xu, Jiale Tao, Hongmei Wang, Donghao Li, Wenqing Yu, Senbo Wang, Zhimin Li, Yetshuan Shi, Haoyu Yang, Yukun Wang, Wenxun Dai, Jiaqi Li, Linqing Wang, Qixun Wang, Zhiyong Xu, Yingfang Zhang, Jiangfeng Xiong, Weijie Kong, Chao Zhang, Hongxin Zhang, Qiaoling Zheng, Weiting Guo, Xinchi Deng, Yixuan Li, Renjia Wei, Yulin Jian, Duojun Huang, Xuhua Ren, Sihuan Lin, Yifu Sun, Yuan Zhou, Joey Wang, Qin Lin, Jingmiao Yu, Jihong Zhang, Caesar Zhong, Di Wang, Yuhong Liu, Linus, Jie Jiang, Longhuang Wu, Shuai Shao, Qinglin Lu
cs.AI
Resumo
A criação inteligente de jogos representa um avanço transformador no desenvolvimento de jogos, utilizando inteligência artificial generativa para gerar e aprimorar dinamicamente o conteúdo dos jogos. Apesar dos progressos notáveis nos modelos generativos, a síntese abrangente de ativos de jogos de alta qualidade, incluindo tanto imagens quanto vídeos, continua sendo uma fronteira desafiadora. Para criar conteúdo de jogos de alta fidelidade que, ao mesmo tempo, esteja alinhado com as preferências dos jogadores e aumente significativamente a eficiência dos designers, apresentamos o Hunyuan-Game, um projeto inovador projetado para revolucionar a produção inteligente de jogos. O Hunyuan-Game abrange dois ramos principais: geração de imagens e geração de vídeos. O componente de geração de imagens é construído sobre um vasto conjunto de dados que compreende bilhões de imagens de jogos, levando ao desenvolvimento de um grupo de modelos personalizados de geração de imagens adaptados para cenários de jogos: (1) Geração Geral de Texto para Imagem. (2) Geração de Efeitos Visuais de Jogos, envolvendo geração de efeitos visuais de jogos baseados em texto e em imagens de referência. (3) Geração de Imagens Transparentes para personagens, cenários e efeitos visuais de jogos. (4) Geração de Personagens de Jogos baseada em esboços, imagens em preto e branco e modelos brancos. O componente de geração de vídeos é construído sobre um conjunto abrangente de dados de milhões de vídeos de jogos e animes, levando ao desenvolvimento de cinco modelos algorítmicos principais, cada um visando pontos críticos de dor no desenvolvimento de jogos e tendo uma robusta adaptação a diversos cenários de vídeos de jogos: (1) Geração de Imagem para Vídeo. (2) Síntese de Vídeo de Avatar com Pose 360 A/T. (3) Geração de Ilustrações Dinâmicas. (4) Super-Resolução de Vídeo Generativa. (5) Geração de Vídeo de Jogo Interativo. Esses modelos de geração de imagens e vídeos não apenas exibem uma expressão estética de alto nível, mas também integram profundamente o conhecimento específico do domínio, estabelecendo uma compreensão sistemática de diversos estilos artísticos de jogos e animes.
English
Intelligent game creation represents a transformative advancement in game
development, utilizing generative artificial intelligence to dynamically
generate and enhance game content. Despite notable progress in generative
models, the comprehensive synthesis of high-quality game assets, including both
images and videos, remains a challenging frontier. To create high-fidelity game
content that simultaneously aligns with player preferences and significantly
boosts designer efficiency, we present Hunyuan-Game, an innovative project
designed to revolutionize intelligent game production. Hunyuan-Game encompasses
two primary branches: image generation and video generation. The image
generation component is built upon a vast dataset comprising billions of game
images, leading to the development of a group of customized image generation
models tailored for game scenarios: (1) General Text-to-Image Generation. (2)
Game Visual Effects Generation, involving text-to-effect and reference
image-based game visual effect generation. (3) Transparent Image Generation for
characters, scenes, and game visual effects. (4) Game Character Generation
based on sketches, black-and-white images, and white models. The video
generation component is built upon a comprehensive dataset of millions of game
and anime videos, leading to the development of five core algorithmic models,
each targeting critical pain points in game development and having robust
adaptation to diverse game video scenarios: (1) Image-to-Video Generation. (2)
360 A/T Pose Avatar Video Synthesis. (3) Dynamic Illustration Generation. (4)
Generative Video Super-Resolution. (5) Interactive Game Video Generation. These
image and video generation models not only exhibit high-level aesthetic
expression but also deeply integrate domain-specific knowledge, establishing a
systematic understanding of diverse game and anime art styles.