小米AI大模型团队迎新帅,雷军千万年薪招揽罗福莉引领创新

   发布时间:2024-12-30 12:03 作者:陆辰风

小米在AI领域再度发力,近日传出消息,该公司创始人雷军不惜以千万年薪的优厚待遇,成功吸引DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉加入,担任小米AI大模型团队的领军人物。这一举措不仅彰显了小米在AI领域的雄心壮志,也预示着小米将加速推进AI大模型技术的研发与应用。

罗福莉,一位在计算机和计算语言学领域拥有深厚学术背景的专家,其职业生涯可谓光彩夺目。本科阶段,她就读于北京师范大学计算机专业,随后在北京大学深造,获得了计算语言学硕士学位。在读研期间,罗福莉就已展现出卓越的科研能力,2019年,她在人工智能领域顶级国际会议ACL上发表了8篇论文,其中包括2篇第一作者论文,这一成就迅速在学术界引起了广泛关注。

毕业后,罗福莉加入了阿里达摩院,从事预训练语言模型的研究工作,并主导开发了多语言预训练模型VECO。随后,她转战幻方量化,专注于深度学习相关策略建模和算法研究。最终,她加入了DeepSeek,参与了MoE大模型DeepSeek-V2的研发工作。罗福莉对DeepSeek-V2模型的评价颇高,认为其中文水平在国内外闭源模型中处于第一梯队,且性价比极高。

小米对AI大模型的投入远不止于此。早在2023年4月,小米就正式组建了AI实验室大模型团队,致力于挖掘AI相关的用户场景,发挥自身技术优势,与合作伙伴共同开拓更多机会。今年11月,小米更是成立了专门的AI平台部,由小米元老级技术大牛张铎担任负责人。张铎在清华计算机系本硕毕业后,凭借卓越的技术实力,被雷军誉为“小米的大神”,并亲切地称为“铎神”。

为了加强AI大模型的研发实力,小米在人才招募和算力投入上均不遗余力。在北京地区,小米大模型相关岗位的招聘数量就多达59个,足见其对人才的渴望。同时,小米正在搭建规模庞大的GPU万卡集群,这一计划由雷军亲自领导,规模较之前大幅增加,旨在满足AI大模型研发对算力的巨大需求。

小米集团总裁卢伟冰透露,预计2024年小米的研发费用将达到240亿元,2025年更是将攀升至300亿元。自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。小米自2016年组建AI团队以来,经过多次扩展,相关领域人员规模已达3000多人。雷军曾表示,小米做大模型的思路与众不同,将主力突破轻量化和本地部署,以在烧钱的大模型业务中平衡成本。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群