巨人网 > 企业 > 正文内容

Meta携手斯坦福，Apollo模型让AI视频理解能力大飞跃！

发布时间：2024-12-18 14:07 来源：ITBEAR 作者：钟景轩

近日，科技巨头meta与斯坦福大学携手，共同推出了一个名为Apollo的全新AI模型系列，这一创新成果在提升机器对视频内容的理解能力上取得了显著突破。

长久以来，尽管人工智能在图像处理和文本分析领域取得了长足进步，但让机器真正“看懂”视频仍然是一个极具挑战性的难题。视频中包含的动态信息错综复杂，处理起来不仅需要强大的计算能力作为支撑，更需要在系统设计层面进行精细化的考量。

针对视频处理的复杂性，Apollo模型采用了双组件设计。其中一个组件专注于分析单个视频帧的内容，而另一个组件则负责追踪对象和场景随时间的变化。这种设计思路使得Apollo能够更全面地捕捉视频中的信息。

在模型训练方面，meta与斯坦福大学的研究团队发现，训练方法的选择比单纯追求模型规模更为重要。Apollo模型采用了分阶段训练策略，按顺序激活模型的不同部分，这种训练方法相较于一次性训练所有部分，能够取得更好的效果。

研究团队还对数据组合进行了不断优化。他们发现，当数据组合中文本数据占比约为10%~14%，且其余部分略微偏向视频内容时，能够最好地平衡语言理解和视频处理能力。这一发现为Apollo模型的训练提供了有力的数据支持。

Apollo模型在不同规模上均展现出了卓越的性能。其中，较小的Apollo-3B模型已经超越了同等规模的Qwen2-VL等模型，而更大的Apollo-7B模型更是超过了参数更大的同类模型。这一系列成就充分证明了Apollo模型在视频理解领域的领先地位。

为了推动AI技术的进一步发展，meta已经开源了Apollo模型的代码和模型权重，并在Hugging Face平台上提供了公开演示。这一举措将有助于更多开发者和研究人员深入了解Apollo模型的工作原理，并基于其进行更深入的研究和应用开发。

更多>同类内容

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

12-10

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

11-24

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

11-24

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

11-24

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

11-24

英伟达加速认证三星AI内存芯片，合作进展如何？

11-24

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

11-24

小米SU7 Ultra车主福利！雷军推专属驾驶培训，80万豪车值不值？

11-24

天钡Aoostar XG76显卡坞海外发布，RX 7600系列加持，价格亲民

11-24

微软启动“零日任务”白帽安全竞赛，奖金翻倍邀你挑战

11-23

南京与合肥共同签署《宁合“双城记”产业对接合作协议》

11-23

红龙M82/Pro有线磁轴键盘京东热售，Gasket结构，最低219元起！

11-23

大众汽车CEO不惧罢工威胁，坚持关厂裁员计划以削减成本

11-23

小牛电动Q3营收增却亏损4090万，李彦如何应对持续亏损挑战？

11-23

小米REDMI Watch 5即将发布，支持接入第三方App功能升级

11-23

点击查看更多 +

全站最新

北京奔驰启动零碳综合创新示范项目，新质赋能打通低碳转型新通道

2025款奥迪Q7燃油SUV来袭，新配置新色彩，起售价60.98万元

一加Ace 5系列配置曝光：处理器、电池快充成Pro版与标准版关键差异

小米YU7内饰成谜，英伟达芯片延迟或影响上市，座舱有何惊喜？

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

马云低调布局印度市场，退休前大动作：半个印度已入其版图？

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

热门内容

本栏最新

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

英伟达加速认证三星AI内存芯片，合作进展如何？

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

小米SU7 Ultra车主福利！雷军推专属驾驶培训，80万豪车值不值？