经过长达十个月的漫长等待,Sora终于在全球观众的瞩目下亮相。北京时间12月10日凌晨,OpenAI在其第三次直播活动中,正式推出了旗下的视频生成模型Sora。
自今年2月首次预告以来,Sora一直保持着神秘的面纱,仅向少数艺术家、知名演员和导演提供试用服务。此次正式发布,立刻引发了全球网友的热烈反响,服务器一度被挤爆。
与之前的版本相比,Sora Turbo在功能上有了显著的提升。它不仅支持生成1080p分辨率、最长可达20秒的视频,还在时长上实现了突破。更重要的是,Sora Turbo提供了丰富的“编辑”功能,用户可以通过指令实现视频的重混、重新剪辑、循环、混合等操作,使得它更像是一个功能强大的视频编辑器。
Sora的正式发布,也引发了国内AI视频生成领域的关注。为了对比国内外产品的差异,“深度洞察”团队第一时间进行了实测。结果显示,国内产品在某些方面并不逊色于Sora。
在视频生成时长方面,Sora以20秒的优势领先,紧随其后的是Runway,可以达到10秒。相比之下,国内的产品普遍在5-6秒左右。但需要注意的是,白日梦虽然最长可达6分钟,但这是通过先生成人物、再生成分镜、编辑图片,最后连成一段视频的方式实现的,所以单次文生视频的长度并不长。
在收费方面,Sora对ChatGPT的Plus会员(每月20美元)和Pro会员(每月200美元)直接开放使用,Plus会员每月可生成50个480P分辨率的视频,而Pro会员则拥有不限次慢速生成的额度。相比之下,国内的产品大多提供免费试用,但会限制使用次数。Runway的收费则位于Sora和国内产品之间,最低月付费15美元。
在功能对比方面,“深度洞察”团队从基础功能和进阶功能两个维度进行了测试。基础功能主要测试文生视频的能力,考察产品对文字指令的理解度、运动过程中人物面部的清晰度和多人物的准确度。测试结果显示,Sora在识别主体数量方面存在不足,但其他方面的表现较为准确。国内产品中,也有部分能够准确理解提示词,但在画风上存在差异。
进阶功能则主要测试Sora发布的新功能。在Remix(重混)功能的测试中,Sora在将兔子替换成小狗时出现了胡萝卜或小狗起飞的状况,说明实际操作并不如样片中那么丝滑。但从业者也表示,这可能与提示词、场景、风格等因素有关。
尽管Sora的发布让人震撼,但目前其实力还不足以让国内从业者感到恐慌。多位从业者表示,Sora在模型效果方面并没有显著变化,而且在长时间处理复杂动作时还存在一定困难。对于Sora发布的一系列新功能,从业者们也见仁见智。有些功能在国内产品中已经实现,而有些功能则属于Sora的独家特色。
尽管如此,Sora的发布仍然给国内AI视频生成领域带来了不小的冲击。随着技术的不断进步和竞争的加剧,未来AI生成视频赛道无疑将更加卷起来。