AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

什么?大模型也许很快就能生成《黑神话·悟空》这种3A大作了?!

《西游记》这就上桌,搭配BGM,有内味儿了(doge)。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

这就是腾讯近日推出的GameGen-O,一个专门生成开放世界视频游戏的Transformer模型。

简单说,这个模型能够模拟各种游戏引擎功能,生成游戏角色、动态环境、复杂动作等等。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

当然也支持交互控制,用户可以通过文本、操作信号和视频提示来控制游戏内容。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

消息一公布就在(前推特)开启了刷屏模式,网友们开始列队尖叫:

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

游戏工作室Azra Games的联创兼CTO更是直言:

GameGen-O将成为游戏工作室的ChatGPT时刻。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

游戏工作室迎来ChatGPT时刻

具体来说,这个项目由腾讯联合港科大、中国科大推出。

推测想要做的事儿,是用AI模型替代一些游戏开发环节。比如目前公布的游戏角色创建、游戏环境生成、动作生成、事件生成以及各种交互控制。

下面我们挨个预览一波~

现在,用GameGen-O就能直接生成各种角色了,西部牛仔、太空人、魔法师、警卫一键生成。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

经费不足造成真实取景困难,也有plan B了!

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

给队友展示骚操作,各种人称视角的动作生成也能轻松拿捏。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

游戏必备环节——给玩家偶尔上亿点难度,海啸、龙卷风、火灾事件这就安排(doge)。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

与此同时,GameGen-O也支持开放域生成,即不限风格、环境、场景那种。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

最后,用文本、操作信号和视频提示就能实现交互,向左、向右、走向黎明

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

好家伙,谁都知道游戏开发有多烧钱,这下,普通玩家也能用GameGen-O制作游戏了。

一位AI架构师网友更是断言:

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

用GPT-4o标注数据

为了开发这个模型,团队自述主要进行了两项工作:

构建专有数据集OGameData,采用GPT-4o标注数据

经历两个阶段的训练过程

具体来说,团队首先提出了一个数据集构建管道。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

团队从互联网上收集了32,000个原始视频,这些视频来自数百款开放世界游戏,时长从几分钟到几小时不等,类型包括角色扮演、第一人称射击、赛车、动作益智游戏等。

然后由人类专家对这些视频进行识别和筛选,最终得到大约15,000个可用视频。

下一步,将筛选后的视频通过场景检测技术切割成片段,并对这些视频片段进行基于美学、光流和语义内容的严格排序和过滤。

接下来使用GPT-4o对超过4,000小时的高质量视频片段进行细致的注释,这些片段的分辨率从720p到4k不等。

为了实现交互控制性,团队从注释后的数据集中选择最高质量的片段,并进行解耦标签(decoupled labeling)。

这种标签设计用于描述片段内容状态的变化,确保训练模型的数据集更加精细和互动。

对于这种人类专家和GPT-4o一起工作的形式,有网友认为:

这是递归自我改进(recursive self-improvement)的一种形式。(人类专家确保了注释的准确性,并通过反馈机制帮助GPT-4o进行自我改进)

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

完成数据准备工作后,团队经过基础预训练+指令调整两个过程来训练GameGen-O。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

在基础训练阶段,GameGen-O模型使用了一个2+1D VAE(变分自编码器,如Magvit-v2)来压缩视频片段。

为了使VAE适应游戏领域,团队对VAE解码器进行了特定领域的调整。

团队采用了不同帧速率和分辨率的混合训练策略,以增强跨帧率和跨分辨率的泛化能力。

另外,模型的整体架构遵循了Latte和OpenSora V1.2框架的原则。

通过使用掩码注意力机制,让GameGen-O具备了文本到视频生成和视频续集的双重能力。

团队介绍称:

这种训练方法,结合OGameData数据集,使得模型能够稳定且高质量地生成开放领域的视频游戏内容,并为后续的交互控制能力奠定了基础。

在这之后,预训练的模型被固定,然后使用可训练的InstructNet进行微调,这使得模型能够根据多模态结构指令生成后续帧。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

InstructNet主要用于接受各种多模态输入,包括结构化文本、操作信号和视频提示。

在InstructNet分支的调整过程中,当前内容被用作条件,从而在当前片段内容和未来片段内容之间建立了映射关系,这在多模态控制信号下进行。

造成的结果是,在推理时,GameGen-O允许用户基于当前片段不断生成和控制下一个生成的片段。

目前,GameGen-O已创建GitHub官方仓库,只不过还没来得及上传代码。

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O

感兴趣的童鞋可以先收藏一波了~

以上就是关于【AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O】的相关消息了,希望对大家有所帮助!

文章来源于网络。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/2024/09/14/21742.html

(0)
北方经济网的头像北方经济网
上一篇 2024 年 9 月 14 日 下午9:20
下一篇 2024 年 9 月 14 日 下午9:20

相关推荐

  • 微软:画图3D应用将于11月4日下架 市场反响未达预期

    快科技8月11日消息,据媒体报道,微软公司近日正式宣告,其Windows操作系统内置的创意工具——画图 3D应用,将于11月4日起停止接收任何后续版本更新,并计划从Microsoft Store中全面撤除。这一决定标志着微软在3D内容创作领域的一次战略调整。 自2016年10月横空出世以来,画图3D便承载着微软在三维设计领域深耕细作的…

    2024 年 8 月 11 日
    2900
  • 英超新闻汇:曼联巨资购买先生伤缺2月?蓝月确实想卖小蜘蛛

    英超新闻汇:曼联巨资购买先生伤缺2月?蓝月确实想卖小蜘蛛 西汉姆联正在推进与曼联关于右后卫万比萨卡的转会协商,据《太阳报》透露,西汉姆有望以1000万英镑基础转会费加上相应浮动条款的条件引进这位26岁的英格兰球员。然而,双方还需解决万比萨卡的个人薪酬要求上的分歧。西汉姆在过往转会中曾因经纪费用问题未能成功引入其他目标,此次对达成万比萨卡的薪资协议持乐观态度。…

    2024 年 8 月 1 日
    3800
  • 中国电竞第一股星竞威武上市!大股东何猷君敲钟:eStar和NIP母公司

    快科技7月29日消息,近日,星竞威武集团(NIP Group)在美国纳斯达克交易所正式敲响上市钟声,股票代码为"NIPG",中国电竞产业迎来了第一股。 星竞威武集团由赌王之子何猷君担任董事长兼CEO,并是公司的第一大股东,持股比例达到14.2%。 集团联席CEO Hicham Chahine持股12.4%,位列第二大股东,此外,知名电竞选…

    2024 年 7 月 29 日
    3800
  • 七彩虹B650、A620主板首发支持AMD锐龙9000系列:套装有福利

    AMD新一代锐龙9000系列依然采用AM5接口,现有的600系列主板只需刷新合适的BIOS就能正常使用,新增的超频功能也不会落下,相当良心。 主板厂商们也已经纷纷行动起来,提前准备好了新版BIOS,包括本土大厂七彩虹,旗下的B650、A620都已就绪! 目前,七彩虹CVN/战斧系列B650主板、战斧系列A620主板,都已经陆续在官网上线了新版BIOS,微代码…

    2024 年 7 月 29 日
    3700
  • 让百万网友深夜破防的手机 我差点以为是智商税

    最近网上冲浪的时候,世超刷到了个爆火的视频。画面里,一个老人略微有些笨拙地使用着智能手机,和我们在屏幕上下翻飞不同,它每一下点得都很用力都很认真,当它摁到女儿兆铃头像时,手机像是被远程控制一样,自动跳转到微信,然后一步步地自动拨打了微信视频。 ;就是这个看起来拍摄技巧十分粗糙的视频,却在抖音上收获了;108 万赞 12 万收藏和 35 万转发。翻开这条视频的…

    2024 年 8 月 17 日
    2500

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信