Deepseek新招NSA,轻松超越马斯克20万显卡Grok3?

   发布时间:2025-02-20 11:37 作者:顾青青

近日,科技界迎来了一场震撼人心的AI竞赛,主角分别是埃隆·马斯克旗下的xAI公司推出的Grok3大模型,以及中国AI企业DeepSeek所发布的一项突破性技术——NSA。

在一场备受瞩目的发布会上,马斯克自信满满地宣布,Grok3是全球最聪明的AI大模型。这一断言并非空穴来风,从各类测试数据来看,Grok3的表现确实令人瞩目,其得分超越了OpenAI和DeepSeek等竞争对手。Grok3之所以能有如此卓越的表现,很大程度上得益于其强大的算力支持——20万张H100显卡的堆叠,使其成为了全球算力巅峰的大模型之一。

马斯克的这一壮举似乎再次印证了规模定律的有效性,即通过不断增加算力投入,AI大模型的性能也将随之提升。然而,就在Grok3发布仅仅一天之后,DeepSeek就抛出了一个重磅炸弹——NSA技术。

DeepSeek在社交平台上发布了一篇关于NSA的纯技术论文报告,详细介绍了这一与硬件高度适配并可原生训练的稀疏注意力机制。NSA不仅能够实现超高速长上下文训练与推理,更重要的是,它通过优化现代硬件设计,降低了预训练的成本,同时保持了卓越的性能。这意味着,NSA无需像Grok3那样堆砌大量显卡,就能实现对其他AI模型的超越。

DeepSeek的NSA技术,延续了其一贯的低成本高效策略。相比之下,Grok3和OpenAI等竞争对手则更加注重算力的堆砌,试图通过大力投入来实现性能的提升。然而,DeepSeek的NSA技术打破了这一常规,证明了在AI领域,智慧和创新同样重要,甚至可能超越单纯的算力竞争。

这一突破性进展让美国的AI公司措手不及。原本,他们以为通过限制中国获得先进的AI芯片,就能保持自己在AI模型上的领先地位。然而,DeepSeek的NSA技术却打破了这一幻想,证明了中国AI企业无需依赖大量显卡,也能实现更强的性能和更好的用户体验。

更重要的是,NSA技术的出现打破了美国在算力方面的垄断地位。这一变革不仅可能重塑整个AI芯片格局,还可能引发AI领域的新一轮创新和竞争。

如今,AI领域的竞争已经不仅仅是算力的比拼,更是智慧和创新的较量。DeepSeek的NSA技术无疑为这场竞赛注入了新的活力,也让人们看到了AI未来的无限可能。

 
 
更多>同类内容
全站最新
热门内容
本栏最新