雷军千万年薪揽95后AI女杰,小米加速布局AI大模型应用场景?

   发布时间:2024-12-30 14:04 作者:唐云泽

近日,网络上热传一则消息,称小米公司创始人雷军以千万年薪成功招募了一位95后的AI天才少女——罗福莉。据相关媒体报道,罗福莉是DeepSeek开源大模型DeepSeek-V2的核心开发者之一,此番加入小米,将担任AI大模型团队的领导角色,工作地点设在小米AI实验室。小米方面对于这一消息尚未作出正式回应。

罗福莉的成长经历颇为励志。她来自四川一个普通家庭,本科阶段在北京师范大学学习计算机专业,凭借优异的成绩获得保研资格,进入北京大学计算语言学研究所深造。硕士毕业后,她因在ACL(国际计算语言学协会)发表8篇论文而名声大噪,并顺利加入阿里巴巴达摩院机器智能实验室。

然而,罗福莉的职业道路并未止步于此。2022年,她选择离开阿里达摩院,加入了量化对冲基金公司幻方量化,专注于深度学习相关策略建模和算法研究。不久后,她再次跳槽,成为北京深度求索人工智能基础技术研究有限公司的一员,担任深度学习研究员,并深度参与了MoE大模型DeepSeek-V2的研发工作。

罗福莉对DeepSeek-V2有着高度评价。在今年5月DeepSeek-V2发布后,她在知乎上发表文章,称赞该模型的中文水平处于国内外闭源模型的第一梯队,同时指出其价格仅为GPT-4的百分之一,堪称性价比之王。而就在几天前,DeepSeek通过官方公众号宣布,全新系列模型DeepSeek-V3首个版本已上线并同步开源,该模型在多项评测中超越了其他开源模型,性能与世界顶尖的闭源模型GPT-4和Claude-3.5-Sonnet不相上下。

DeepSeek-V3不仅在百科知识、长文本、代码、数学、中文能力等方面表现出色,尤其在数学领域更是大放异彩。在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(2024)上,DeepSeek-V3大幅超越了所有开源和闭源模型。通过算法和工程上的创新,DeepSeek-V3的生成速度从20 TPS提升至60 TPS,相比V2.5模型实现了三倍的提升。而该模型的训练成本仅为600万美元,相比之前降低了十倍,资源运用效率极高。

小米作为一家拥有众多应用终端的公司,包括手机和汽车等,其在AI领域的投入一直备受关注。根据2024年第三季度财报显示,小米集团的AIoT平台已连接的IoT设备数超过8.61亿,同比增长23.2%。此次雷军亲自出手招募罗福莉,无疑释放出小米将加大AI领域投入的信号。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群