站内搜索 | 手机版

巨人财经 - 专业科技行业财经媒体

巨人网 > 快讯 > 正文内容

李飞飞团队s1模型揭秘：基于阿里Qwen，50美元云费用挑战AI推理巅峰？

发布时间：2025-02-06 22:55 来源：ITBEAR 作者：唐云泽

近期，李飞飞研究团队宣布了一项引人注目的成就：他们成功以极低的云计算成本——不到50美元，训练出了一款名为s1的人工智能推理模型。该模型在数学解题与编程能力测试中，展现出了与业界顶尖模型，如OpenAI的o1和DeepSeek的R1相媲美的表现。

然而，这一成果很快引发了外界的质疑。有网友指出，s1模型并非完全从零开始训练，而是基于阿里云的通义千问（Qwen）模型进行了进一步开发。为了核实这一信息，新浪科技联系了阿里云方面，并得到了确认。

阿里云方面详细回应称，s1模型是以阿里通义千问Qwen2.5-32B-Instruct开源模型为基础，通过16块H100 GPU进行26分钟的监督微调后得到的。新模型s1-32B在数学及编码能力测试中，取得了与o1和R1等尖端模型相当的效果，甚至在解决竞赛数学问题上的表现，还超出了o1-preview模型27个百分点。

据了解，s1团队在创建该模型时，采用了“蒸馏”技术。这一技术的核心在于，通过训练模型来学习另一个已有人工智能模型的答案，从而提取其推理能力。s1的论文指出，他们使用了一种称为监督微调（SFT）的方法，利用相对较小的数据集来实施蒸馏。在SFT过程中，人工智能模型被明确指示在数据集中模仿特定的行为模式。

值得注意的是，s1模型是基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型、现成的免费模型进行开发的。为了训练s1，研究人员精心策划了一个包含1000个问题及其答案的数据集，同时还参考了谷歌Gemini 2.0 Flash Thinking Experimental为每个答案提供的“思考”过程。

此次s1模型的成功，不仅展示了低成本、高效率训练人工智能模型的潜力，也引发了业界对于模型微调与蒸馏技术的进一步关注。这一成果有望为人工智能领域的发展带来新的启示和动力。

更多>同类内容

小红书企业号直播全攻略：如何高效策划与执行直播活动？

02-06

八马茶业再冲IPO，高端茶路能否借港交所“续杯”？

02-06

哪吒领跑，中国电影市场能否借最强春节档迎来新曙光？

02-06

县城AI新风貌：返乡见闻中的科技与生活交织图景

02-06

启明星辰携手DeepSeek大模型，全场景安全智能化迎来全新升级！

02-06

百度智能云自研万卡集群，能否再次引领AI大模型降价潮？

02-06

索尼PS5销量暴跌，任天堂Switch2能否稳坐日本游戏机市场头把交椅？

02-06

春节营销大战打响，品牌如何创新突围抢流量？

02-06

安谋科技迎新舵手：瑞芯微前副总陈锋接棒CEO

02-06

高通2024Q4财报亮眼：营收增长近两成，净利超31亿美元

02-06

华为MatePad Pro 12.2英寸平板鸿蒙NEXT Beta版招募开启，你准备好了吗？

02-06

比亚迪元UP欧洲新名ATTO 2上市，续航312km城市里程达463km

02-06

芝奇携手Splave，DDR5内存超频新世界纪录诞生：6367.5MHz！

02-06

DeepSeek崛起：国产AI的务实创新与技术狂欢

02-06

周鸿祎送车抽奖陷争议，用户吐槽没诚意他喊冤

02-06

点击查看更多 +

全站最新

徕卡LUX手柄来袭！MagSafe+两段式快门，摄影爱好者新宠售价2380元

徕卡LUX手柄来袭！MagSafe+两段式快门，摄影爱好者新宠售价2380元

2024年中国汽车整车出口大增，全年销量突破640万辆！

2024年中国汽车整车出口大增，全年销量突破640万辆！

《哪吒之魔童闹海》票房破62亿，跃居全球影史单一市场票房榜亚军！

《哪吒之魔童闹海》票房破62亿，跃居全球影史单一市场票房榜亚军！

伊朗首艘无人机航母亮相：海上驻扎一年，无需加油！

伊朗首艘无人机航母亮相：海上驻扎一年，无需加油！

DeepSeek崛起！云服务与芯片大厂争相支持，生态构建势不可挡

DeepSeek崛起！云服务与芯片大厂争相支持，生态构建势不可挡

软银收购Ampere半导体公司，前英特尔高管蕾妮·詹姆斯创办，估值65亿

软银收购Ampere半导体公司，前英特尔高管蕾妮·詹姆斯创办，估值65亿

亚信安全多股东减持股份，套现逾两千万元

亚信安全多股东减持股份，套现逾两千万元

广汽集团换帅冯兴亚，能否带领企业破浪前行迎考新征途？

广汽集团换帅冯兴亚，能否带领企业破浪前行迎考新征途？

热门内容

本栏最新

李飞飞团队s1模型揭秘：基于阿里Qwen，50美元云费用挑战AI推理巅峰？

李飞飞团队s1模型揭秘：基于阿里Qwen，50美元云费用挑战AI推理巅峰？

小红书企业号直播全攻略：如何高效策划与执行直播活动？

小红书企业号直播全攻略：如何高效策划与执行直播活动？

八马茶业再冲IPO，高端茶路能否借港交所“续杯”？

八马茶业再冲IPO，高端茶路能否借港交所“续杯”？

哪吒领跑，中国电影市场能否借最强春节档迎来新曙光？

哪吒领跑，中国电影市场能否借最强春节档迎来新曙光？

县城AI新风貌：返乡见闻中的科技与生活交织图景

县城AI新风貌：返乡见闻中的科技与生活交织图景

启明星辰携手DeepSeek大模型，全场景安全智能化迎来全新升级！

启明星辰携手DeepSeek大模型，全场景安全智能化迎来全新升级！

百度智能云自研万卡集群，能否再次引领AI大模型降价潮？

百度智能云自研万卡集群，能否再次引领AI大模型降价潮？

索尼PS5销量暴跌，任天堂Switch2能否稳坐日本游戏机市场头把交椅？

索尼PS5销量暴跌，任天堂Switch2能否稳坐日本游戏机市场头把交椅？

巨人财经微信：netspread（注明:巨人财经）简体繁体根据客户端智能切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2023 jur.com.cn All rights reserved. 鲁ICP备11015305号-4