DeepSeek-V3开源上线,性能超阿里Qwen、Meta Llama,定价亲民引关注

   发布时间:2024-12-27 11:27 作者:朱天宇

近日,国内AI领域的创新力量深度求索(DeepSeek)公司宣布,其最新研发的DeepSeek-V3系列模型的首个版本已在12月26日晚正式上线,并且实现了同步开源。这一举措标志着DeepSeek在大型语言模型技术上的又一次重大突破。

据官方介绍,DeepSeek-V3在多个权威评测集上的表现令人瞩目,不仅超越了阿里云的Qwen2.5-72B和meta的Llama-3.1-405B等开源大模型,还逼近了GPT-4o和Claude-3.5-Sonnet等备受瞩目的顶尖闭源模型。这一成绩无疑为DeepSeek的技术实力提供了有力的证明。

在成本方面,DeepSeek-V3的训练成本相较于一些顶尖模型而言显得更为经济。据官方技术论文透露,v3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本则高达约1亿美元。这一成本优势使得DeepSeek-V3在性价比方面更具吸引力。

为了让更多的用户能够体验到DeepSeek-V3的强大功能,深度求索公司还制定了优惠的定价策略。具体而言,用户在使用DeepSeek-V3时,每百万输入tokens的费用为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens的费用则为8元。公司还为用户提供了45天的优惠价格体验期,以便用户能够更充分地了解和使用这一模型。

深度求索公司在今年5月就曾率先在国内发起了大模型价格战,通过降低价格来推动大模型的普及和应用。此次DeepSeek-V3的上线和开源,不仅进一步巩固了深度求索在大模型领域的领先地位,也为整个AI行业的发展注入了新的活力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群