Hunyuan-Game: Промышленная модель интеллектуального создания игр
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model
May 20, 2025
Авторы: Ruihuang Li, Caijin Zhou, Shoujian Zheng, Jianxiang Lu, Jiabin Huang, Comi Chen, Junshu Tang, Guangzheng Xu, Jiale Tao, Hongmei Wang, Donghao Li, Wenqing Yu, Senbo Wang, Zhimin Li, Yetshuan Shi, Haoyu Yang, Yukun Wang, Wenxun Dai, Jiaqi Li, Linqing Wang, Qixun Wang, Zhiyong Xu, Yingfang Zhang, Jiangfeng Xiong, Weijie Kong, Chao Zhang, Hongxin Zhang, Qiaoling Zheng, Weiting Guo, Xinchi Deng, Yixuan Li, Renjia Wei, Yulin Jian, Duojun Huang, Xuhua Ren, Sihuan Lin, Yifu Sun, Yuan Zhou, Joey Wang, Qin Lin, Jingmiao Yu, Jihong Zhang, Caesar Zhong, Di Wang, Yuhong Liu, Linus, Jie Jiang, Longhuang Wu, Shuai Shao, Qinglin Lu
cs.AI
Аннотация
Интеллектуальное создание игр представляет собой революционный прорыв в разработке игр, использующий генеративный искусственный интеллект для динамического создания и улучшения игрового контента. Несмотря на значительные успехи в области генеративных моделей, комплексный синтез высококачественных игровых ресурсов, включая как изображения, так и видео, остается сложной задачей. Для создания высококачественного игрового контента, который одновременно соответствует предпочтениям игроков и значительно повышает эффективность работы дизайнеров, мы представляем проект Hunyuan-Game, инновационную разработку, призванную революционизировать интеллектуальное производство игр. Hunyuan-Game включает два основных направления: генерацию изображений и генерацию видео. Компонент генерации изображений основан на обширном наборе данных, включающем миллиарды игровых изображений, что привело к созданию группы специализированных моделей генерации изображений, адаптированных для игровых сценариев: (1) Общая генерация изображений из текста. (2) Генерация визуальных эффектов для игр, включая создание эффектов на основе текста и эталонных изображений. (3) Генерация прозрачных изображений для персонажей, сцен и визуальных эффектов. (4) Генерация игровых персонажей на основе эскизов, черно-белых изображений и белых моделей. Компонент генерации видео основан на всеобъемлющем наборе данных, включающем миллионы игровых и аниме-видео, что привело к разработке пяти ключевых алгоритмических моделей, каждая из которых направлена на решение критических проблем в разработке игр и обладает высокой адаптацией к различным игровым видео-сценариям: (1) Генерация видео из изображений. (2) Синтез видео с аватарами в 360 A/T позах. (3) Генерация динамических иллюстраций. (4) Генеративное улучшение разрешения видео. (5) Генерация интерактивных игровых видео. Эти модели генерации изображений и видео не только демонстрируют высокий уровень эстетической выразительности, но и глубоко интегрируют знания в предметной области, формируя системное понимание разнообразных художественных стилей игр и аниме.
English
Intelligent game creation represents a transformative advancement in game
development, utilizing generative artificial intelligence to dynamically
generate and enhance game content. Despite notable progress in generative
models, the comprehensive synthesis of high-quality game assets, including both
images and videos, remains a challenging frontier. To create high-fidelity game
content that simultaneously aligns with player preferences and significantly
boosts designer efficiency, we present Hunyuan-Game, an innovative project
designed to revolutionize intelligent game production. Hunyuan-Game encompasses
two primary branches: image generation and video generation. The image
generation component is built upon a vast dataset comprising billions of game
images, leading to the development of a group of customized image generation
models tailored for game scenarios: (1) General Text-to-Image Generation. (2)
Game Visual Effects Generation, involving text-to-effect and reference
image-based game visual effect generation. (3) Transparent Image Generation for
characters, scenes, and game visual effects. (4) Game Character Generation
based on sketches, black-and-white images, and white models. The video
generation component is built upon a comprehensive dataset of millions of game
and anime videos, leading to the development of five core algorithmic models,
each targeting critical pain points in game development and having robust
adaptation to diverse game video scenarios: (1) Image-to-Video Generation. (2)
360 A/T Pose Avatar Video Synthesis. (3) Dynamic Illustration Generation. (4)
Generative Video Super-Resolution. (5) Interactive Game Video Generation. These
image and video generation models not only exhibit high-level aesthetic
expression but also deeply integrate domain-specific knowledge, establishing a
systematic understanding of diverse game and anime art styles.Summary
AI-Generated Summary