腾讯混元发布游戏视觉生成平台,首个工业级AIGC游戏内容生产引擎

5月20日,腾讯正式发布混元游戏视觉生成平台(简称“混元游戏”),这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎,大幅优化游戏资产生成与游戏制作流程。其面向游戏工业级内容生产,为游戏美术设计师提供一系列AI工具,帮助游戏设计厂商快速生成符合创作意图的高质量游戏素材/概念草案,让游戏美术设计效率提升数十倍。

混元游戏基于混元图像生成与视频生成大模型,针对游戏美术设计场景进行深度优化,让模型更懂游戏美术、更能理解游戏美术的常见术语。基于跨领域采集的百万级游戏与动漫视频多模态精品数据集,混元游戏创新性地构建了多个核心算法模型矩阵,每个模型均针对游戏研发中的关键痛点进行专项优化。

目前,该“混元游戏”通过腾讯混元官网提供体验入口,面向游戏行业设计师开放申请,欢迎希望体验的设计师进行申请。

腾讯混元官网-创作者社区-行业专区-游戏-立即体验

混元游戏现阶段已经上线的能力包括AI美术管线、实时画布、AI 2D美术生成、专业角色多视图生成等核心能力,集中在游戏美术概念设计环节。整体而言,设计师输入手绘草图与提示词,或者单纯的提示词,即可快速将灵感产出为高质量的设计图和3D建模的多视图。

除了已经开放体验申请的能力以外,混元游戏视觉生成平台还有更多正在内部研发和测试的能力暂未上线。本次也以技术报告的方式,面向行业详尽地展示和分享了腾讯混元游戏视觉生成系列大模型Hunyuan-Game,包括四大游戏图像生成模型和五大游戏视觉生成模型等。

四大核心功能:提升游戏原画设计效率

在平台已上线的四个核心能力包括AI美术管线、实时画布、AI 2D美术生成、专业角色多视图生成。

其中,AI美术管线能力无缝集成多个AI工具,无需跳转即可在一个页面“完成获取灵感->绘制角色概念草图->生成标准角色多视图”整个工作流程,实现了从“灵感”到“交付”零跳转。比如设计师输入文本如“一个厚涂风格的可爱动漫少女”,AI可即时生成角色灵感图集,并在同一页面内完成手绘草图渲染、标准三视图生成及360°动态演示视频输出,彻底告别多工具切换的碎片化流程。

全流程管线化:从“灵感”到“交付”零跳转

实时画布主要是借助实时AI能力,设计师通过手绘草图快速生成并即时修正概念设计,“边画边看” 提高创作效率。设计师绘制粗略线条、绘制草图示意,并加上提示词描述,AI就会在约一秒内生成并呈现结果,同步渲染细节。设计师可以随时进行调整笔触、角色姿态、场景光影等,并获得即时反馈,让用户可以专注于创意本身,实现“边画边改”的沉浸式创作体验,实现更高自由度的创作的同时大幅提升了生产效率。同时,基于腾讯混元自研的全球首个实时生成引擎,避免了传统生图时代漫长的等待时间。

实时画布:秒级响应,所见即所得

AI 2D美术灵感提供AI文生图/图生图能力,背后是游戏专用的2D美术生图大模型,能够理解各种游戏名词、概念、风格描述,实现更精准还原游戏领域的概念创意。比如,用户输入“魔兽风格银色盾牌,符文环绕”,即可生成可直接用于3D建模的素材;上传武器草图,即可派生“刀刃幽蓝流光、握柄宝石镶嵌”的系列变体;同时支持透明通道图生成。

该游戏专用模型基于百万级游戏动漫数据训练的垂类模型,具备原生中文Prompt深度解析能力 ,可精准还原“厚涂、赛璐璐、赛博朋克”等专业术语,支持写实、卡通、东方神话、仙侠玄幻等多种主流游戏风格和题材。

AI 2D美术灵感:游戏专用生图模型,精准理解“游戏语言”

在传统游戏美术设计流程中,游戏美术设计师在制作完原画人物原画之后,需要针对该人物绘制角色的三视图,让3D建模师能够准确地理解原画师的想法,制作出精美、符合设计的游戏人物。

借助混元游戏视觉生成能力,游戏美术设计师仅需上传单张角色原画,混元AI即可一键生成符合行业规范的标准三视图及360°旋转视频,用于后续的3D建模。如果设计师对某个生成的细节不满意,可以进行手动修改。角色多视图生成耗时从传统12小时压缩至几分钟到30分钟,主体一致性达99%。目前,该能力已应用于多个头部游戏项目,助力美术团队效率提升300%。

多视图生成,十倍效率提升

发布Hunyuan-Game游戏视觉生成大模型技术报告

除了已经开放体验申请的能力以外,混元游戏视觉生成团队还有更多正在内部研发和测试的能力暂未上线。本次也以技术报告的方式面向行业详尽地展示和分享了多个游戏图像和视频视觉生成大模型。

腾讯混元内部将Hunyuan-Game定位首个为工业级游戏内容资产生成打造的AIGC系列大模型。技术报告显示,其涵盖完整的游戏图像和视频模型能力矩阵,包括四大游戏图像模型与五大视频模型等,能力覆盖全面。

四大图像生成模型包括游戏生图大模型底座、特效生成模型、透明图生成模型、角色原画生成模型。其中游戏特效生成模型是业界首款达到头部游戏标准的游戏特效生成系列模型,覆盖17种特效类型和5大类风格,帮助设计师激发在特效原画设计过程中的创意灵感、提升制作效率,填补 AIGC 在游戏特效领域空白。

五大游戏视频模型包括图生成视频底座模型(I2V)、 角色多视图模型、角色动态立绘模型、游戏视频超分模型,以及实时交互模型。

游戏图生视频底座模型(HunyuanGame-I2V)能够从静态图像生成高质量游戏视频,专门在游戏和动漫的垂类场景数据上进行了训练,在游戏视频生成上有明显的优势。

A/T pose角色360°多视图生成模型(HunyuanGame-Turnaround)是业界首个多视图生成模型,支持将任意姿态的角色原画解析实现360°旋转视频生成并保持角色一致性。

角色动态立绘生成模型(HunyuanGame-Live2D)基于图生视频模型,通过首尾帧条件控制实现游戏场景角色立绘循环微动的效果,并保持高时序一致性。

游戏视频超分模型(HunyuanGame-SR)支持将低分辨率的游戏动漫类视频资产转变为2K高清视频,能够在不损失细节的情况下提升视频质量,适用于游戏重制和高清化需求,是游戏动漫领域最好的视频修复模型之一。

交互式游戏视频模型(HunyuanGame-Craft)可以实现实时、长时间、动态内容的游戏场景视频交互式生成,支持用户通过外设键盘信号交互生成对应的视频内容,适用于开放世界游戏场景。

腾讯混元是行业领先的全链路自研大模型体系,涵盖文本、图像、视频、3D等多个模态。混元游戏视觉生成技术的推出,标志着其在垂直产业落地中迈出了重要的一步。