巨人网 > 产经 > 正文内容

谷歌Veo 2视频生成器来袭，能否超越OpenAI的Sora成新宠？

发布时间：2024-12-17 15:33 来源：ITBEAR 作者：柳晴雪

谷歌在近日宣布了其视频生成模型Veo的最新版本——Veo 2，正式向OpenAI的Sora发起挑战，标志着AI视频生成领域的竞争进一步加剧。据谷歌介绍，Veo 2在生成视频内容的逼真度上有了显著提升。

与此同时，谷歌还推出了图像生成模型Imagen的升级版Imagen 3，旨在为用户提供更加细腻且内容丰富的图片生成体验。

谷歌强调，Veo 2在理解现实世界的物理规律以及捕捉人类动作和表情的微妙之处上取得了显著进步。目前，该模型已在谷歌实验室的VideoFX平台上开放试用，但仅限于通过谷歌表格注册并加入等候名单的用户，且需等待谷歌在特定时间段的临时开放。

谷歌在官方博客中提到，Veo 2不仅擅长生成视频内容，还能根据用户指定的类型、镜头以及电影特效建议，制作出最高可达4K分辨率的视频，充分展现了其在电影制作手法上的精通。

值得注意的是，Veo 2生成的视频将嵌入谷歌特有的元数据水印SynthID，以此作为AI生成内容的标识。尽管Veo 2目前仍处于测试阶段，但谷歌表示，与原始版本的Veo相比，新版本将大幅减少如多余手指等“幻觉”现象的出现。

在谷歌的内部测试中，Veo在“总体偏好”和“提示依从性”两项关键指标上均超越了Sora及其他竞争对手的AI模型，为争夺电影制作人及内容创作者的市场奠定了坚实基础。此前，谷歌曾在I/O开发者大会上首次公布Veo，并与演员兼音乐人唐纳德·格洛沃合作，共同制作了一段展示视频。

AI视频生成技术作为生成式AI领域的重要分支，一直备受关注。除了谷歌和OpenAI等大模型开发者外，RunwayML等较小规模的公司也在这一领域展开了激烈竞争。RunwayML最近推出了Gen-3 Alpha Turbo模型，提供了更强大的控制能力；Pika Labs则发布了Pika 2.0，赋予用户更多控制权，并支持在视频中加入自定义角色。Luma AI与亚马逊AWS合作，将其模型引入Bedrock平台，以满足企业级需求。

然而，AI视频生成技术仍面临创作者和观众的质疑。例如，Sora在发布后就被用户指出存在内容违背物理规律和人体结构的问题，结果表现不一致。在最近的游戏奖颁奖典礼上，观众对所谓“AI劣质内容”的不信任感也有所体现，这进一步加剧了人们对AI生成内容质量的担忧。

尽管如此，仍有部分电影制作人开始探索AI视频生成器的潜力。著名导演詹姆斯·卡梅隆加入了Stability AI的董事会，演员安迪·瑟金斯也宣布成立一家专注于AI的制作公司。谷歌表示，许多用户对其AI视频生成工具展现出浓厚兴趣，YouTube创作者已开始利用VideoFX平台为短片制作背景，以提升制作效率。

谷歌还对其图像生成模型Imagen进行了全面升级，推出了Imagen 3。该模型已在Gemini聊天机器人中提供服务，生成的图像更加逼真且色彩鲜艳。Imagen 3能够更准确地渲染多种艺术风格，包括写实主义、印象派、抽象艺术及动画风格，同时在遵循用户提示方面的表现也得到了显著提升。用户可通过ImageFX平台访问并使用Imagen 3。

更多>同类内容