小米在AI大模型领域的步伐近期明显加快,一系列动作透露出公司在这一领域的雄心壮志。
据悉,小米成功招募到AI行业的顶尖人才——罗福莉。这位被誉为“95后天才少女”的专家,曾是DeepSeek开源大模型DeepSeek-V2的关键开发者。据知情人士透露,小米创始人雷军亲自参与招募,罗福莉的薪酬水平或将达到千万元级别。她或将加入小米AI实验室,领导小米的大模型团队。
罗福莉的背景令人瞩目。她硕士毕业于北京大学计算语言学研究所,并在NLP(自然语言处理)国际顶级会议ACL上发表过多篇论文,其中包括两篇第一作者论文,一度引发知乎热议。毕业后,她加入阿里达摩院机器智能实验室,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。之后,她转战幻方量化从事深度学习研究,并最终加入DeepSeek。
罗福莉的加入,不仅因为其卓越的技术实力,更因为她身上的标签与小米的品牌调性高度契合。小米以其“营销天团”著称,而罗福莉的“天才AI少女”形象,无疑将为小米增添更多话题性和关注度。
事实上,小米在AI领域的布局早已开始。自2016年7月起,小米便着手AI技术的研发。近年来,公司在AI领域的研发投入不断加大,并成立了多个相关团队和实验室。2020年,小米更是将核心战略升级为“手机×AIoT”,进一步深化在AI领域的布局。
然而,在AI大模型领域,小米的步伐相对谨慎。直到2023年4月,小米AI实验室才正式组建起大模型团队。团队负责人曾表示,小米不搞AI的军备竞赛,而是选择主力突破轻量化和本地部署。这一策略与小米一贯注重产品性价比的理念相吻合。
然而,随着AI技术的不断发展,以及友商在AI大模型领域的不断进击,小米也开始感受到压力。2023年年底,各大手机厂商的旗舰机发布会上,AI能力的介绍都占据了极大篇幅。相比之下,小米在自家手机的AI能力宣传上显得低调许多,这也引发了市场对小米AI能力是否硬核的质疑。
为了应对这一挑战,小米开始加快在AI大模型领域的步伐。除了招募罗福莉这样的顶尖人才外,小米还在着手搭建自己的GPU万卡集群。据悉,小米大模型团队在成立时已有6500张GPU资源,而随着新集群的搭建,这一数字还将进一步增加。
小米还在不断升级和优化自己的大模型。11月12日,小米大模型团队发布公告表示,小米大模型已升级至第二代。大模型在10大能力纬度上表现相较于上一代平均提升了超过45%,同时丰富了参数矩阵,有从0.3B到30B多个参数规模,分别适配云边端各侧设备。这一升级使得小米的大模型在云端场景下的需求也得到了满足。