在蛇年新春之际,人工智能领域传来了一则令人瞩目的消息:中国的DeepSeek公司正以其独特的人工智能解决方案在全球舞台上崭露头角。该公司自豪地宣称,其人工智能模型相较于美国同行,展现出了更为显著的成本效益,这一优势使得DeepSeek应用程序在51个国家中大受欢迎。
DeepSeek的成功背后,离不开华为Ascend 910C芯片的鼎力支持。据悉,DeepSeek的大语言模型DeepSeek R1在训练阶段采用了英伟达的H100 GPU,但在推理环节——即生成人工智能响应的过程中——则转而依赖华为的Ascend 910C芯片。这一策略不仅大幅降低了成本,还有效减少了对美国技术的依赖。
DeepSeek相较于Open AI的成本优势尤为明显。DeepSeek R1的预训练费用仅为557.6万美元,使用2048块英伟达H800 GPU集群运行55天即可完成。而在API调用成本方面,DeepSeek R1更是以每百万输入tokens仅需0.55美元的价格,远低于OpenAI-o1模型的15美元。DeepSeek R1还支持在本地消费硬件上运行精简版本,从而完全避免了云费用的支出。
人工智能研究员Dorialexander指出,Ascend 910C芯片主要用于推理而非训练。训练人工智能模型需要强大的计算能力,而这正是英伟达GPU所擅长的。相比之下,推理过程所需的功率较少,使得华为的Ascend 910C芯片成为了一个可行的替代方案。这种结合使用不同芯片的策略,既保持了高性能,又实现了成本节约。
然而,Ascend 910C芯片并非没有局限性。它缺乏训练大规模人工智能模型所需的能力,因此中国的人工智能公司在模型开发方面仍然依赖英伟达。为了克服这一挑战,华为正在积极研发Ascend 920C芯片,旨在与英伟达的顶级人工智能芯片Blackwell B200一较高下。如果研发成功,这将为中国企业提供一个强大的国产选择。
DeepSeek R1的开源性质和低成本策略使其在发布后迅速获得了广泛关注。其开源代码和训练方法不仅为开发者提供了极大的灵活性,还有助于推动AI技术的普及与创新。这一举措无疑将进一步加速人工智能技术的发展和应用。
DeepSeek的崛起不仅展示了中国在人工智能领域的雄心壮志,还预示着整个行业可能迎来的变革。其成本效益战略和华为在硬件方面的不断进步,可能会对整个行业产生深远影响。中美科技巨头在人工智能领域的较量,无疑将决定这一技术的未来走向。这种竞争将推动未来几年内的创新、降低成本并提升全球影响力。
对于关注人工智能发展的读者来说,DeepSeek的故事无疑是一个值得期待的精彩篇章。让我们共同期待这一领域未来更多的惊喜和突破吧!