微软提出NUWA-XL多模自动生成式人工智能模型，以16组描述句生成11分钟长度影片

老哥 • 2024年11月19日 11:05 • 网络游戏

微软亚洲研究院近期提出名为NUWA-XL的多模自动生成式人工智能模型，标榜能以16组描述句即可生成长达11分钟的视频内容。

937ga937ga937ga

微软亚洲研究院在2021年便提出多模自动生成式人工智能模型NUWA （女娲），能以自然语言描述生成文字、图像、视频内容，后续推出的升级版NUWA-Infinity更进一步将生成图像、视频分辨率提高。

而此次提出的NUWA-XL，则是建立在「扩散叠加」（Diffusion over Diffusion）的运作架构之上，通过全域扩散模型（Global Diffusion）生成视频所有时间范围内的关键画面，并且通过局部扩散模型（Local Diffusion）依据填加关键画面邻近内容，藉此加快整体内容生成效率，同时也确保生成内容连续性与完整性。

整体流程大约是先依照输入描述句生成关键画面，再依序针对关键画面生成相应视频，并且通过扩散模型增加视频内容长度，让视频最初生成的概略章节可以变成完整故事内容。在演示内容中，微软以《摩登原始人》（The Flintstones）动画为基础，自动生成全新动画内容。

fbntsfbntsfbnts

在微软此项技术中，原本生成1024个画面的平均推论时间需要7.55分钟，变成仅需花费26秒即可生成，整体速度提升高达94.26%。

不过，微软说明视频生成背后依然需要仰赖足够品质的视频内容训练，此次提出的NUWA-XL主要参考专业动画内容制作流程，藉由先生成关键画面，并且持续生成关键画面衍生内容，进而构成完整动画视频，并且确保内容连续性与生成品质，进而能加速内容生成速度。

赞 (0)

0

网络游戏

Epic Games发出新招：游戏在Epic商店独占上架半年内可拿100%收益

Epic Games 过往为了对抗劲敌 Steam 平台，经常举办大撒币活动，提供多款游戏免费下载，或是通过游戏独占发行策略，藉此吸引用户建立 Epic Games Store 平…

2024年12月20日
网络游戏

数码宝贝 25 周年经典复刻！万代『怪兽对打机COLOR Ver.3/ Ver.4/ Ver.5』怀旧升级再回归！

为纪念《数码宝贝》诞生25周年，日本万代玩具公司继大人气的「怪兽对打机COLOR（Ver.1/Ver.2）」后，好评再推出最新商品「怪兽对打机COLOR（Ver.3/Ver.4/V…

2024年11月19日
网络游戏

DDR5时代真正降临！ Intel H610入门主板也要支持

DDR5取代DDR4成为主流只是个时间问题，而今随着DDR5的价格逐渐平民化，两条16GB 4800MHz价格亲民，表示时间到了。 AMD Zen4 Ryzen 7000系列直接抛…

2024年11月16日
网络游戏

最快下月登场！ Google 中端新机 Pixel 7a「活泼新色」实照流出

此为旗舰款的 Pixel 7 系列（图/翻摄百度官网）百度新一代中端手机 Pixel 7a 要来了？传言最快于下月I/O开发者大会登场，知名爆料客OnLeaks抢先一步释出官方…

2024年11月16日
网络游戏

游戏鼠标什么牌子最好(游戏鼠标排行榜前十名)

在打游戏的时候，特别是电脑端游，设备都是非常重要的。除了主机，显示器，还要有手感好的键盘和鼠标。好的鼠标，操作灵活，手感好，可以让我们的游戏体验也达到最优。一、Razer…

2024年12月20日
网络游戏

经营模拟游戏《龙背上的农家》将于 4 月 28 日正式上架 PlayStation 4

PLAYISM 宣布，在巨大的龙背上享受慢节奏生活的经营模拟游戏《龙背上的农家》，将于 2023 年 4 月 28 日正式登陆 PlayStation 4。本作是 WOLF RP…

2024年11月18日

发表回复