OpenAI 于上个月中推出 Sora 文字生成视频模型后,可说立刻引发大量讨论,其拟真程度让人非常惊艳,不过可惜的是,只有开发给特定用户使用,意味着绝大多数人都还没办法用,也有网友猜测很可能今年看不到,要明年才有机会。 近日 OpenAI 终于透露关于 Sora 的推出时程,好消息是,官方表示今年一定会看到。

OpenAI 透露 Sora 文字生成视频会在今年晚些时间正式推出
OpenAI 几天前接受了华尔街日报的采访,其首席技术主管Mira Murati就明确提到“Sora在今年一定会推出”, “可能几个月内就会看到”,意味着2024年一定会看到Sora正式推出,并开放给所有人,而且有机会不用等太久,搞不好几个月后就来了。
这真的是不错消息,终于快可以玩到这个强大的文字生成视频工具,只不过到时是独立推出,还是跟 DALL-E 一样,同捆在 ChatGPT Plus,这就不太确定了。 有媒体推测,会捆绑在ChatGPT Plus,因为在正式推出之前,OpenAI在尝试把Sora变得效能更强、价格更便宜,目标是生成视频的速度就跟DALL-E一样。
但我是认为不太可能,因为就先前的推测,OpenAI Sora 生成一分钟视频很可能就要花一个多小时,除了时间久外,也代表需要消耗大量计算效能,成本花费一定比单纯生成文字、图片还高很多,而跟 ChatGPT Plus 绑在一起,除非涨价,要不然全面开放后,上万个用户都在使用,成本绝对是非常高。 而且别忘了,Sora 文字生成视频所消耗的电力成本一定也非常高。
也有可能OpenAI会限制ChatGPT Plus的Sora能力,如果想要获得更多,则需要额外加价。

Mira Murati 还透露一个不错的新功能,就是 OpenAI 也在计划整合音频,这会使视频变得更加逼真。 另外也考虑加入编辑功能,让用户创建完视频之后,可进行修改编辑和创作。
主持人还有问 Sora 是使用哪些数据训练,Mira Murati 就没有正面回答,只说到 “我不打算详细介绍使用的数据,但数据是公开或有许可的”。
另外就目前释出的视频来看,Sora 还有很多需要改进的地方,尤其是遇到一些特殊情况,如:无法理解的情况下,动物或人可能会突然出现。 生成某些动作时,也会发生错误,进而导致不自然的画面。
无论如何,至少时间已经确定了,想要玩玩看的人可以先期待一下。 而微软的 Copilot,上个月微软也已经确定会整合 Sora,但没意外应该仅限 Copilot Pro 会员使用。