谷歌公司近期在人工智能领域取得了新的突破,正式推出了其最新的视频生成模型Veo 2。据官方介绍,这一新模型在理解现实世界物理规律、人类运动及表情细节方面有了显著提升,所生成的视频在整体细节和逼真度上均达到了新的高度。
Veo 2模型能够生成最高分辨率为4K(4096 x 2160像素)、时长可达2分钟的视频片段。与OpenAI的Sora模型相比,Veo 2在分辨率上提升了4倍,时长则是后者的6倍。这一技术突破无疑为视频内容的创作和生成提供了更多的可能性和想象空间。
然而,目前Veo 2模型在谷歌的实验性视频创建工具VideoFX中的表现还受到一定限制,其分辨率上限为720p,时长也仅为8秒。不过,谷歌DeepMind产品副总裁Eli Collins表示,公司会根据用户的反馈在接下来的几个月里继续进行迭代和优化,以期达到更好的效果。
Veo 2模型在功能上也十分强大,它不仅可以根据给定的文本提示或文本和参考图像生成视频,还能够更真实地模拟运动、流体动力学和光的属性。据DeepMind介绍,Veo 2能够呈现出不同的镜头和电影效果,以及“细致入微”的人类表情和动作,使得生成的视频更加生动和真实。
为了降低Deepfake等潜在风险,DeepMind还采取了相应的技术防范措施。他们利用专有的水印技术SynthID,将隐形标记嵌入到Veo 2生成的帧中,从而实现对生成视频的追踪和识别。这一举措无疑为视频内容的真实性和安全性提供了有力保障。
Veo 2模型在实际应用中也展现出了其强大的创作能力。例如,当给定一段描述蜜蜂、农夫和向日葵场景的文本提示时,Veo 2能够生成一段生动逼真的视频,其中蜜蜂在镜头中飞舞,农夫在阳光下举起蜂蜜罐,向日葵在微风中摇曳,整个场景充满了金色的光线和丰富的质感。
Veo 2还能够根据文本提示生成卡通风格的视频。例如,当给定一段描述可爱卡通女孩在1980年代厨房里与摄影机对话的文本时,Veo 2能够生成一段充满活力和动感的视频,其中女孩的表情和动作都十分生动和真实。
最后,Veo 2还能够捕捉和呈现自然场景中的美丽瞬间。例如,当给定一段描述粉红色火烈鸟在宁静泻湖中优雅涉水的文本时,Veo 2能够生成一段令人惊叹的视频,其中火烈鸟的羽毛在阳光下闪烁着美丽的光芒,整个场景充满了宁静和自然之美。