站内搜索 | 手机版

巨人财经 - 专业科技行业财经媒体

巨人网 > 企业 > 正文内容

ChatGPT后浪推前浪，国产o1大模型加速崛起能否弯道超车？

发布时间：2024-12-02 22:22 来源：ITBEAR 作者：冯璃月

在ChatGPT问世后的第二年，人工智能领域正经历一场新的变革。OpenAI及其国内同行正试图超越现有的技术框架，探索大模型发展的新路径。

随着Scaling Law的局限性逐渐显现，今年9月，OpenAI推出了全新系列模型o1，重新定义了“会思考的大模型”。OpenAI的CEO奥特曼对此信心满满，认为AI的发展不仅没有放缓，反而预示着未来几年内的重大突破。

受到o1发布的启发，国内大模型厂商迅速行动，纷纷效仿并推出了各自的o1类深度思考模型。短短两个多月内，kimi的k0 math、Deepseek的DeepSeek-R1-Lite以及昆仑万维的“天工大模型4.0”o1版相继问世，这些模型都着重强调了大模型的逻辑思考能力。

在没有OpenAI公开o1具体技术细节的情况下，国内企业展现出了惊人的研发速度和技术实力。11月16日，月之暗面发布了k0 math，通过强化学习和思维链推理技术，显著提升了数学推理能力。四天后，Deepseek推出了DeepSeek-R1-Lite，毫无保留地展示了模型的完整思考过程，其思维链长度可达数万字，并在多项测试中超越了o1-Preview。

昆仑万维也不甘落后，于11月27日发布了天工大模型4.0 o1版，成为国内首款实现中文逻辑推理的模型。该模型提供了三种版本，包括开源的Skywork O1 Open、优化中文支持能力的Skywork O1 Lite，以及完整展示模型思考过程的Skywork O1 Preview。

这些国产“o1”大模型不仅在数学和代码能力上逼近甚至超过了o1，还学会了“慢思考”。通过引入思维链（CoT），大模型能够将复杂问题拆解为多个小问题，模拟人类的逐步推理过程。这种能力使得大模型在解决一些往常无法回答的问题时，也能给出正确答案。

例如，Deepseek R1在面对“Responsibility中有几个字母i？”的问题时，能够拆解单词并逐一比较字母，最终给出正确答案。昆仑万维的大模型在面对陷阱问题时，也能通过思维链模式自行避开问题，找到准确的翻译结果。

然而，慢思考模型也面临着挑战。虽然它们在一些特定学科上的表现大幅提升，但大量耗费tokens的方式却未必能换来用户需要的回报。在某些情况下，增加思维链的长度可以提高效率，但并不意味着在所有情况下都是最优解。因此，大模型需要学会对问题难度进行判别，从而决定是否采用深度思考模式。

从特定场景下的强化学习应用转向通用模型，在训练算力和成本的平衡上还存在一定难度。目前，国产慢思考大模型的开发主要基于规模较小的基座模型，如Skywork O1 Open基于Llama 3.1 8B的开源模型。这意味着在训练RL阶段，所需的算力可能并不比预训练少。

尽管如此，大厂们仍将o1视为下一个必备项。在OpenAI和智谱给出的“通往AGI五阶段”的定义中，o1的出现标志着大模型能力突破到了L2阶段，开始真正拥有逻辑思维能力。国内厂商在同步跟进o1类产品的同时，已经开始思考如何将o1的能力与现有AI应用方向结合。

在数据枯竭的情况下，o1为Scaling Law提供了新的支撑。更多大模型公司的加入，将联手探索出更大的可能性。同时，思维链的能力已经帮助提升了AI技术的使用效果。例如，智谱的“会反思的AI搜索”结合了思维链能力，能够给出更加精准的答案。

当大模型开始学会“自我思考”，通往L3（Agent）的大门也正在被推开。然而，如何平衡大模型的推理进化和用户对效率的需求，仍然是国内大模型厂商需要解决的问题。

更多>同类内容

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

12-10

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

11-24

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

11-24

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

11-24

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

11-24

英伟达加速认证三星AI内存芯片，合作进展如何？

11-24

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

11-24

小米SU7 Ultra车主福利！雷军推专属驾驶培训，80万豪车值不值？

11-24

天钡Aoostar XG76显卡坞海外发布，RX 7600系列加持，价格亲民

11-24

微软启动“零日任务”白帽安全竞赛，奖金翻倍邀你挑战

11-23

南京与合肥共同签署《宁合“双城记”产业对接合作协议》

11-23

红龙M82/Pro有线磁轴键盘京东热售，Gasket结构，最低219元起！

11-23

大众汽车CEO不惧罢工威胁，坚持关厂裁员计划以削减成本

11-23

小牛电动Q3营收增却亏损4090万，李彦如何应对持续亏损挑战？

11-23

小米REDMI Watch 5即将发布，支持接入第三方App功能升级

11-23

点击查看更多 +

全站最新

小米YU7内饰成谜，英伟达芯片延迟或影响上市，座舱有何惊喜？

小米YU7内饰成谜，英伟达芯片延迟或影响上市，座舱有何惊喜？

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

马云低调布局印度市场，退休前大动作：半个印度已入其版图？

马云低调布局印度市场，退休前大动作：半个印度已入其版图？

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

中国移动小面额话费充值服务在多地微信支付宝下架

中国移动小面额话费充值服务在多地微信支付宝下架

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

钟睒睒“一鸣”惊人，快手泯然“一笑”？

钟睒睒“一鸣”惊人，快手泯然“一笑”？

热门内容

本栏最新

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

比亚迪仰望U7插混版亮相，首款水平对置发动机引关注！

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

英伟达CEO黄仁勋：用作业搭讪妻子，20岁就立志30岁当CEO

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

小米海外业绩亮眼，国内吐槽不断，海外市场成其新增长点？

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

英伟达加速认证三星AI内存芯片，合作进展如何？

英伟达加速认证三星AI内存芯片，合作进展如何？

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

小米SU7 Ultra车主福利！雷军推专属驾驶培训，80万豪车值不值？

小米SU7 Ultra车主福利！雷军推专属驾驶培训，80万豪车值不值？

巨人财经微信：netspread（注明:巨人财经）简体繁体根据客户端智能切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2023 jur.com.cn All rights reserved. 鲁ICP备11015305号-24

微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群