Hunyuan-Game : Modèle de création de jeux intelligents de niveau industriel
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model
May 20, 2025
Auteurs: Ruihuang Li, Caijin Zhou, Shoujian Zheng, Jianxiang Lu, Jiabin Huang, Comi Chen, Junshu Tang, Guangzheng Xu, Jiale Tao, Hongmei Wang, Donghao Li, Wenqing Yu, Senbo Wang, Zhimin Li, Yetshuan Shi, Haoyu Yang, Yukun Wang, Wenxun Dai, Jiaqi Li, Linqing Wang, Qixun Wang, Zhiyong Xu, Yingfang Zhang, Jiangfeng Xiong, Weijie Kong, Chao Zhang, Hongxin Zhang, Qiaoling Zheng, Weiting Guo, Xinchi Deng, Yixuan Li, Renjia Wei, Yulin Jian, Duojun Huang, Xuhua Ren, Sihuan Lin, Yifu Sun, Yuan Zhou, Joey Wang, Qin Lin, Jingmiao Yu, Jihong Zhang, Caesar Zhong, Di Wang, Yuhong Liu, Linus, Jie Jiang, Longhuang Wu, Shuai Shao, Qinglin Lu
cs.AI
Résumé
La création intelligente de jeux représente une avancée transformative dans le développement de jeux, utilisant l'intelligence artificielle générative pour générer et améliorer dynamiquement le contenu des jeux. Malgré des progrès notables dans les modèles génératifs, la synthèse complète d'actifs de jeu de haute qualité, incluant à la fois des images et des vidéos, reste une frontière difficile à franchir. Pour créer un contenu de jeu à haute fidélité qui s'aligne simultanément sur les préférences des joueurs et augmente significativement l'efficacité des concepteurs, nous présentons Hunyuan-Game, un projet innovant conçu pour révolutionner la production intelligente de jeux. Hunyuan-Game englobe deux branches principales : la génération d'images et la génération de vidéos. Le composant de génération d'images est construit sur un vaste ensemble de données comprenant des milliards d'images de jeux, conduisant au développement d'un groupe de modèles de génération d'images personnalisés pour les scénarios de jeux : (1) Génération générale d'images à partir de texte. (2) Génération d'effets visuels de jeux, impliquant la génération d'effets visuels de jeux à partir de texte et d'images de référence. (3) Génération d'images transparentes pour les personnages, les scènes et les effets visuels de jeux. (4) Génération de personnages de jeux basée sur des esquisses, des images en noir et blanc et des modèles blancs. Le composant de génération de vidéos est construit sur un ensemble de données complet de millions de vidéos de jeux et d'anime, conduisant au développement de cinq modèles algorithmiques centraux, chacun ciblant des points critiques dans le développement de jeux et ayant une adaptation robuste à divers scénarios de vidéos de jeux : (1) Génération de vidéos à partir d'images. (2) Synthèse de vidéos d'avatar en pose 360 A/T. (3) Génération d'illustrations dynamiques. (4) Super-résolution générative de vidéos. (5) Génération interactive de vidéos de jeux. Ces modèles de génération d'images et de vidéos non seulement présentent une expression esthétique de haut niveau, mais intègrent également profondément des connaissances spécifiques au domaine, établissant une compréhension systématique des divers styles artistiques de jeux et d'anime.
English
Intelligent game creation represents a transformative advancement in game
development, utilizing generative artificial intelligence to dynamically
generate and enhance game content. Despite notable progress in generative
models, the comprehensive synthesis of high-quality game assets, including both
images and videos, remains a challenging frontier. To create high-fidelity game
content that simultaneously aligns with player preferences and significantly
boosts designer efficiency, we present Hunyuan-Game, an innovative project
designed to revolutionize intelligent game production. Hunyuan-Game encompasses
two primary branches: image generation and video generation. The image
generation component is built upon a vast dataset comprising billions of game
images, leading to the development of a group of customized image generation
models tailored for game scenarios: (1) General Text-to-Image Generation. (2)
Game Visual Effects Generation, involving text-to-effect and reference
image-based game visual effect generation. (3) Transparent Image Generation for
characters, scenes, and game visual effects. (4) Game Character Generation
based on sketches, black-and-white images, and white models. The video
generation component is built upon a comprehensive dataset of millions of game
and anime videos, leading to the development of five core algorithmic models,
each targeting critical pain points in game development and having robust
adaptation to diverse game video scenarios: (1) Image-to-Video Generation. (2)
360 A/T Pose Avatar Video Synthesis. (3) Dynamic Illustration Generation. (4)
Generative Video Super-Resolution. (5) Interactive Game Video Generation. These
image and video generation models not only exhibit high-level aesthetic
expression but also deeply integrate domain-specific knowledge, establishing a
systematic understanding of diverse game and anime art styles.Summary
AI-Generated Summary