Grok3能否超越DeepSeek，马斯克的大模型新篇章有何真功夫？

发布时间：2025-02-17 09:04 来源：刀马物语作者：任飞扬

在科技领域，一场由DeepSeek引领的变革正在悄然改变全球对大模型的认知。DeepSeek不仅重新定义了算力与算法的结合，还促使科技企业进行深度反思，其开源特性更是给OpenAI带来了不小的压力，迫使后者也踏上了免费服务的道路。在国内市场，类似的免费推广也层出不穷，这一切变化，无疑要归功于DeepSeek的横空出世。

科技巨头们纷纷接入DeepSeek，无疑是对其算法的极大认可。DeepSeek的出现，不仅改变了市场的认知，还激发了更多创新。最近，科技界又迎来了一则重磅消息：马斯克宣布，其旗下的xAI公司即将推出大模型Grok的迭代版——Grok 3。据马斯克透露，Grok 3将于太平洋时间周一晚8点正式发布，并现场演示其强大功能。

马斯克一贯擅长利用各种场合进行宣传，此次也不例外。他自信地表示，Grok 3拥有极强的推理能力，在测试中表现优于所有已发布的产品。言下之意，Grok 3的推理能力甚至超过了ChatGPT和DeepSeek，这无疑是对自己产品的高度自信。

然而，Grok 3是否真的能成为“地球上最聪明的AI”，还需等待发布后才能验证。回顾Grok大模型的发展历程，我们不难发现，xAI一直在不断探索和进步。2023年11月，xAI推出了首款大模型Grok-1，标志着其在大模型领域的初步尝试。2024年3月，xAI又推出了参数量高达3140亿的Grok-1模型，远超OpenAI GPT-3.5的1750亿参数量，成为当时参数量最大的开源大语言模型。

同年8月，xAI又推出了Grok 2大模型，主要应用于训练AI聊天机器人。与Grok 1相比，Grok 2在训练数据的使用上进行了改进，融入了少量高质量的真实世界数据，弥补了初代模型在处理真实场景方面的不足。而即将发布的Grok 3，则更进一步引入了“思维链”推理能力，能够像人类一样逐步处理复杂任务，显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。

马斯克透露，Grok 3已完成预训练，其计算量比Grok 2高10倍。他一直紧追OpenAI的步伐，如今又增加了对DeepSeek的追赶。在DeepSeek推出之初，马斯克就曾表示认可，但同时也透露xAI将推出更强大的模型。如今看来，Grok 3正是这样的存在。马斯克认为，大模型市场的真正“革命”需要更底层技术的突破，如多模态融合和生成式AI的深度应用。

DeepSeek的“低价高能”模式推动了大模型的商业化落地，但马斯克认为真正的变革需要技术的质变而非单纯优化。对于算力不足的企业来说，算法的突出性使得它们也能布局自己的专业化大模型应用，这才是最关键的。这也预示着全球AI竞赛的激烈程度将持续升级，未来充满了无限可能。

更多>同类内容