AMD集成DeepSeek模型至GPU,DeepSeek V3或已超GPT-4成最强开源LLM?

   发布时间:2025-02-05 10:15 作者:苏婉清

AMD近日宣布了一项重大进展,其Instinct MI300X GPU已成功集成了全新的DeepSeek-V3模型。这一举措标志着AMD在追求与SGLang协同实现极致性能方面迈出了重要一步。

据AMD官方介绍,DeepSeek V3不仅是一款开源的大型语言模型,更在性能上超越了备受瞩目的GPT-4,被誉为当前最强的开源LLM。这一突破性的进展无疑为AMD的技术实力增添了浓墨重彩的一笔。

DeepSeek V3 FP8在首发之日便实现了在英伟达和AMD GPU上的流畅运行。这一成果得益于SGLang与DeepSeek团队的紧密合作,双方共同努力,确保了模型的兼容性和高效性。

在推动DeepSeek模型的发展过程中,AMD还特别感谢了美团搜索与推荐算法平台团队以及DataCrunch所提供的GPU资源支持。这些宝贵的资源为DeepSeek模型的训练和优化提供了坚实的基础。

自DeepSeek-R1大模型发布以来,其迅速在中美两地苹果应用市场的免费榜上崭露头角,登顶榜单。这一成就不仅彰显了DeepSeek模型的强大实力,也吸引了众多科技巨头的关注。亚马逊、微软等公司纷纷宣布将接入DeepSeek模型,以进一步提升其业务领域的智能化水平。

曾经对DeepSeek持批评态度的OpenAI也转变了态度。OpenAI首席执行官奥尔特曼在东京公开表示,公司没有起诉DeepSeek的计划。他强调,OpenAI将继续致力于打造出色的产品,并以模型能力引领世界。同时,奥尔特曼对DeepSeek模型给予了高度评价,称其为“令人印象深刻的模型”,并表示对有一个新的竞争者感到高兴。

 
 
更多>同类内容
全站最新
热门内容
本栏最新