Sora正式发布，国内AI视频生成工具能否迎头赶上？

发布时间：2024-12-11 16:05 来源：蓝鲸新闻作者：江紫萱

经过长达十个月的漫长等待，Sora终于在全球观众的瞩目下亮相。北京时间12月10日凌晨，OpenAI在其第三次直播活动中，正式推出了旗下的视频生成模型Sora。

自今年2月首次预告以来，Sora一直保持着神秘的面纱，仅向少数艺术家、知名演员和导演提供试用服务。此次正式发布，立刻引发了全球网友的热烈反响，服务器一度被挤爆。

与之前的版本相比，Sora Turbo在功能上有了显著的提升。它不仅支持生成1080p分辨率、最长可达20秒的视频，还在时长上实现了突破。更重要的是，Sora Turbo提供了丰富的“编辑”功能，用户可以通过指令实现视频的重混、重新剪辑、循环、混合等操作，使得它更像是一个功能强大的视频编辑器。

Sora的正式发布，也引发了国内AI视频生成领域的关注。为了对比国内外产品的差异，“深度洞察”团队第一时间进行了实测。结果显示，国内产品在某些方面并不逊色于Sora。

在视频生成时长方面，Sora以20秒的优势领先，紧随其后的是Runway，可以达到10秒。相比之下，国内的产品普遍在5-6秒左右。但需要注意的是，白日梦虽然最长可达6分钟，但这是通过先生成人物、再生成分镜、编辑图片，最后连成一段视频的方式实现的，所以单次文生视频的长度并不长。

在收费方面，Sora对ChatGPT的Plus会员（每月20美元）和Pro会员（每月200美元）直接开放使用，Plus会员每月可生成50个480P分辨率的视频，而Pro会员则拥有不限次慢速生成的额度。相比之下，国内的产品大多提供免费试用，但会限制使用次数。Runway的收费则位于Sora和国内产品之间，最低月付费15美元。

在功能对比方面，“深度洞察”团队从基础功能和进阶功能两个维度进行了测试。基础功能主要测试文生视频的能力，考察产品对文字指令的理解度、运动过程中人物面部的清晰度和多人物的准确度。测试结果显示，Sora在识别主体数量方面存在不足，但其他方面的表现较为准确。国内产品中，也有部分能够准确理解提示词，但在画风上存在差异。

进阶功能则主要测试Sora发布的新功能。在Remix（重混）功能的测试中，Sora在将兔子替换成小狗时出现了胡萝卜或小狗起飞的状况，说明实际操作并不如样片中那么丝滑。但从业者也表示，这可能与提示词、场景、风格等因素有关。

尽管Sora的发布让人震撼，但目前其实力还不足以让国内从业者感到恐慌。多位从业者表示，Sora在模型效果方面并没有显著变化，而且在长时间处理复杂动作时还存在一定困难。对于Sora发布的一系列新功能，从业者们也见仁见智。有些功能在国内产品中已经实现，而有些功能则属于Sora的独家特色。