近期,国产AI大模型DeepSeek在全球范围内引发了广泛关注,并随之曝光了一位95后的AI领域“天才少女”——罗福莉。据悉,小米公司创始人雷军亲自出面,以千万年薪的待遇,成功将这位关键开发者招致麾下,领导小米的AI大模型团队。
这张雷军视频号上的图片,记录了这一重要时刻。罗福莉的背景和成就令人瞩目,她本科就读于北京师范大学计算机专业,硕士阶段则在北京大学计算语言学专业深造。早在2019年,还在北大攻读硕士学位的她就已在人工智能领域的顶级国际会议ACL上发表了8篇论文,其中2篇为第一作者,这一成就迅速让她登上了知乎热搜。
罗福莉本人在知乎上回应称,这些论文是她近一年的研究成果,她付出了足够的努力,当然其中也不乏运气的成分。毕业后,她先后加入了阿里达摩院和幻方量化,从事人工智能研究和深度学习相关策略建模,期间主导开发了多语言预训练模型VECO,并参与了MoE大模型DeepSeek-V2的研发。
罗福莉在个人公众号上分享的照片,展现了她的专业风采。DeepSeek-V2发布后,她在知乎上发表了对该模型的看法,认为其中文水平在国内外闭源模型中处于第一梯队,且性价比极高。
罗福莉的加入,是小米全面发力AI大模型战略的一个重要环节。自2023年4月正式组建AI实验室大模型团队以来,小米一直在不断挖掘AI相关的用户场景,并发挥自身技术优势,以开放的态度与合作伙伴开拓更多机会。今年11月,小米还成立了专门的AI平台部,由小米的元老级技术大牛张铎担任负责人。
从小米招聘的官方页面可以看到,仅北京地区大模型相关的岗位就多达59个,显示出小米在AI领域的雄心壮志。除了招募人才,小米还在加大AI和算力的投入,计划搭建GPU万卡集群,规模远超之前。这一计划由雷军亲自领导,并已实施数月。
小米集团总裁卢伟冰透露,预计2024年小米的研发费用将达到240亿元,2025年更是将攀升至300亿元。从2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。目前,小米的AI团队规模已达3000多人。
在二级市场上,小米加码AI算力的举措也推动了其股价的上涨。小米汽车宣布已提前完成全年所有目标,交付量超过13万辆。12月27日,小米股价创下2022年以来的新高,盘中触及34.95港元/股。雷军在公开演讲中曾表示,小米做大模型的思路与众不同,选择主力突破的是轻量化和本地部署,如何在烧钱的大模型业务中平衡成本,是雷军考虑的核心问题。而罗福莉的加入,或许正是小米解决这一问题的关键。