在科技领域,一场由DeepSeek引领的变革正在悄然改变全球对大模型的认知。DeepSeek不仅重新定义了算力与算法的结合,还促使科技企业进行深度反思,其开源特性更是给OpenAI带来了不小的压力,迫使后者也踏上了免费服务的道路。在国内市场,类似的免费推广也层出不穷,这一切变化,无疑要归功于DeepSeek的横空出世。
科技巨头们纷纷接入DeepSeek,无疑是对其算法的极大认可。DeepSeek的出现,不仅改变了市场的认知,还激发了更多创新。最近,科技界又迎来了一则重磅消息:马斯克宣布,其旗下的xAI公司即将推出大模型Grok的迭代版——Grok 3。据马斯克透露,Grok 3将于太平洋时间周一晚8点正式发布,并现场演示其强大功能。
马斯克一贯擅长利用各种场合进行宣传,此次也不例外。他自信地表示,Grok 3拥有极强的推理能力,在测试中表现优于所有已发布的产品。言下之意,Grok 3的推理能力甚至超过了ChatGPT和DeepSeek,这无疑是对自己产品的高度自信。
然而,Grok 3是否真的能成为“地球上最聪明的AI”,还需等待发布后才能验证。回顾Grok大模型的发展历程,我们不难发现,xAI一直在不断探索和进步。2023年11月,xAI推出了首款大模型Grok-1,标志着其在大模型领域的初步尝试。2024年3月,xAI又推出了参数量高达3140亿的Grok-1模型,远超OpenAI GPT-3.5的1750亿参数量,成为当时参数量最大的开源大语言模型。
同年8月,xAI又推出了Grok 2大模型,主要应用于训练AI聊天机器人。与Grok 1相比,Grok 2在训练数据的使用上进行了改进,融入了少量高质量的真实世界数据,弥补了初代模型在处理真实场景方面的不足。而即将发布的Grok 3,则更进一步引入了“思维链”推理能力,能够像人类一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。
马斯克透露,Grok 3已完成预训练,其计算量比Grok 2高10倍。他一直紧追OpenAI的步伐,如今又增加了对DeepSeek的追赶。在DeepSeek推出之初,马斯克就曾表示认可,但同时也透露xAI将推出更强大的模型。如今看来,Grok 3正是这样的存在。马斯克认为,大模型市场的真正“革命”需要更底层技术的突破,如多模态融合和生成式AI的深度应用。
DeepSeek的“低价高能”模式推动了大模型的商业化落地,但马斯克认为真正的变革需要技术的质变而非单纯优化。对于算力不足的企业来说,算法的突出性使得它们也能布局自己的专业化大模型应用,这才是最关键的。这也预示着全球AI竞赛的激烈程度将持续升级,未来充满了无限可能。