昆仑万维SkyReels-V2开源:革新视频生成,无限时长电影级质量新突破

   发布时间:2025-04-21 16:41 作者:苏婉清

昆仑万维旗下的SkyReels团队近日宣布了一项重大技术突破,正式推出了名为SkyReels-V2的视频生成模型,并宣布该模型将全面开源。这一创新模型被赞誉为全球首个采用扩散强迫框架的无限时长电影生成系统,为视频生成技术带来了革命性的进展。

SkyReels-V2通过融合多模态大语言模型、多阶段预训练、强化学习以及独特的扩散强迫技术,成功克服了当前视频生成领域的一系列挑战。在保持高质量视觉效果的同时,该模型实现了运动流畅度的显著提升,打破了高分辨率视频时长受限的瓶颈,并增强了电影语法理解能力,使得生成的视频更具专业镜头感知。

技术层面,SkyReels团队展示了其在视频生成领域的深厚积累。团队开发的SkyCaptioner-V1视频理解模型能够精准捕捉视频中的主体、表情和动作信息,通过人工标注和模型训练,进一步提升了镜头语言的理解能力。为了优化运动质量,团队采用强化学习训练,并设计了半自动数据收集管道,高效生成对比数据,确保视频的动态表现更加自然流畅。

在长视频生成方面,SkyReels-V2提出了创新的扩散强迫后训练方法。该方法通过非递减噪声时间表,大幅降低了连续帧去噪时间表的搜索空间,使得长视频的生成成为可能。目前,SkyReels-V2已经能够支持生成30至40秒的高保真、高一致性视频,且质量卓越。

为了全面评估SkyReels-V2的性能,昆仑万维团队构建了SkyReels-Bench测评基准,并利用开源V-Bench进行自动化评估。评估结果显示,SkyReels-V2在VBench1.0中的总分和质量分均高达83.9%和84.7%,远超包括华为轩辕视频模型在内的其他对比模型,彰显了其在视频生成领域的领先地位。

在应用场景上,SkyReels-V2展现了强大的功能多样性。它支持基于滑动窗口方法的理论无限时长故事视频生成,提供两种图像到视频合成方案,包括微调全序列T2V扩散模型和扩散强迫模型与帧条件结合。该模型还具备专门筛选百万级样本优化的摄像导演功能,以及基于SkyReels-V2基座模型研发的SkyReels-A2多元素到视频生成方案,为用户提供了丰富的创作选择。

昆仑万维SkyReels团队的开源举措无疑将推动视频生成技术的进一步发展。他们将SkyCaptioner-V1和SkyReels-V2系列模型(包括1.3B、5B、14B等多种尺寸)全面开源,涵盖了扩散强迫、文本到视频、图像到视频、摄像导演和元素到视频等多个领域,为学术界和产业界提供了宝贵的研究资源。

随着SkyReels-V2的发布和开源,视频生成技术将迎来新的发展机遇。这一创新模型不仅提升了视频生成的质量和效率,更为用户提供了更多元化的创作可能,预示着视频生成技术未来的无限潜力。

同时,昆仑万维SkyReels团队的开源精神也将激励更多企业和研究机构投入到视频生成技术的研究和应用中,共同推动这一领域的蓬勃发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新