在瑞士达沃斯举行的世界经济论坛上,微软首席执行官萨提亚·纳德拉对一项源自中国的AI技术表达了高度赞赏。他特别提到了DeepSeek的新模型,称赞其在高效开发开源模型及推理计算方面的卓越表现,并强调这些技术进展不容忽视。
DeepSeek-R1近期在大模型竞技榜上取得了显著成绩,与ChatGPT-4o(发布于2024年11月20日)并列前三,而其开源且成本仅为后者的二十分之一的特点尤为引人注目。此前已有消息透露,Facebook母公司meta成立了四个专项研究小组,致力于解析DeepSeek的工作原理,并期望借此改进其旗下的大模型Llama。
DeepSeek-R1推理大模型于1月20日正式发布,据官方介绍,该模型在后训练阶段大规模应用了强化学习技术,即便在标注数据极少的情况下,也显著提升了模型的推理能力。在数学、代码编写以及自然语言推理等多项任务上,DeepSeek-R1的性能与OpenAI的o1正式版不相上下。
更令人瞩目的是,Deepseek应用在发布后不久便迅速攀升至苹果中国及美国地区应用商店免费App下载排行榜的榜首位置,甚至在美国市场的下载榜上超越了ChatGPT,展现了其强大的市场吸引力和用户基础。