雷军千万年薪揽95后AI女杰，小米加速布局AI大模型应用场景？

发布时间：2024-12-30 14:04 来源：多知网作者：唐云泽

近日，网络上热传一则消息，称小米公司创始人雷军以千万年薪成功招募了一位95后的AI天才少女——罗福莉。据相关媒体报道，罗福莉是DeepSeek开源大模型DeepSeek-V2的核心开发者之一，此番加入小米，将担任AI大模型团队的领导角色，工作地点设在小米AI实验室。小米方面对于这一消息尚未作出正式回应。

罗福莉的成长经历颇为励志。她来自四川一个普通家庭，本科阶段在北京师范大学学习计算机专业，凭借优异的成绩获得保研资格，进入北京大学计算语言学研究所深造。硕士毕业后，她因在ACL（国际计算语言学协会）发表8篇论文而名声大噪，并顺利加入阿里巴巴达摩院机器智能实验室。

然而，罗福莉的职业道路并未止步于此。2022年，她选择离开阿里达摩院，加入了量化对冲基金公司幻方量化，专注于深度学习相关策略建模和算法研究。不久后，她再次跳槽，成为北京深度求索人工智能基础技术研究有限公司的一员，担任深度学习研究员，并深度参与了MoE大模型DeepSeek-V2的研发工作。

罗福莉对DeepSeek-V2有着高度评价。在今年5月DeepSeek-V2发布后，她在知乎上发表文章，称赞该模型的中文水平处于国内外闭源模型的第一梯队，同时指出其价格仅为GPT-4的百分之一，堪称性价比之王。而就在几天前，DeepSeek通过官方公众号宣布，全新系列模型DeepSeek-V3首个版本已上线并同步开源，该模型在多项评测中超越了其他开源模型，性能与世界顶尖的闭源模型GPT-4和Claude-3.5-Sonnet不相上下。

DeepSeek-V3不仅在百科知识、长文本、代码、数学、中文能力等方面表现出色，尤其在数学领域更是大放异彩。在美国数学竞赛（AIME 2024, MATH）和全国高中数学联赛（2024）上，DeepSeek-V3大幅超越了所有开源和闭源模型。通过算法和工程上的创新，DeepSeek-V3的生成速度从20 TPS提升至60 TPS，相比V2.5模型实现了三倍的提升。而该模型的训练成本仅为600万美元，相比之前降低了十倍，资源运用效率极高。

小米作为一家拥有众多应用终端的公司，包括手机和汽车等，其在AI领域的投入一直备受关注。根据2024年第三季度财报显示，小米集团的AIoT平台已连接的IoT设备数超过8.61亿，同比增长23.2%。此次雷军亲自出手招募罗福莉，无疑释放出小米将加大AI领域投入的信号。

更多>同类内容