在科技领域的快速演进中,一系列震撼性事件正逐步揭开人工智能新时代的序幕。近日,随着特朗普重返白宫并宣布重启“星际之门”项目Stargate Project,全球科技版图再次被震撼。该项目由OpenAI、甲骨文及软银携手,计划在未来四年内斥资5000亿美元,全力投入到AI基础设施的建设中,众多科技巨头如Arm、微软、英伟达等也位列初始技术合作伙伴之中。此举被视为美国在AI领域的“曼哈顿计划”,预示着人类正加速迈向通用人工智能(AGI)的新纪元。
与此同时,在中国,各大头部大模型企业亦不甘落后,春节前夕密集发布了一系列推理模型更新。DeepSeek的R1、Kimi的k1.5、智谱的GLM-Zero以及阶跃星辰的Step-1o系列等,均剑指OpenAI的GPT系列模型,展现了中国企业在AI领域的强劲追赶势头。
集体智能的涌现,标志着中国厂商在经历两年的高强度研发后,不仅通过跟随式创新显著缩小了与国际领先水平的差距,更探索出了一条以更少资源实现高性能的独特路径。如今,中国AI行业正站在原创式创新与大规模商用的临界点上。
尤为引人注目的是,字节跳动于1月22日正式发布了豆包大模型1.5系列。其中,Doubao-1.5-pro在知识、代码、推理等多项权威测评中全面超越GPT-4o和Claude 3.5 Sonnet,达到全球顶尖水平。同时,该模型已集成至火山方舟平台,提供服务且价格保持不变,实现了性价比的极大提升。
过去一年,字节跳动在大模型领域的增长速度令人瞩目。从年初被外界担忧入局过晚,到年末取得的一系列辉煌战果,字节跳动的转型之路堪称“慢思考、快执行”的经典案例。据QuestMobile数据,截至2024年12月,豆包APP的月活跃用户已达7523万,日均Tokens使用量超过4万亿。豆包大模型与火山引擎的组合,成功打破了B端企业市场和云计算的传统格局。
此次发布的豆包大模型1.5系列,涵盖了多个版本以满足不同需求:Doubao-1.5-pro以满血性能支持256k长文本,多项测试得分优于业界一流模型;Doubao-1.5-lite则以轻量级成本提供旗舰级性能,响应速度极快;Doubao-1.5-vision-pro在视觉理解方面全面升级,能够处理多模态数据;Doubao-1.5-realtime-voice-pro则实现了端到端的语音对话功能,已在豆包APP全量上线。
Doubao-1.5-pro在多个权威测评基准上均取得了最佳成绩,无论是处理中文文本、搜索专业知识、编程开发还是复杂逻辑推理任务,均表现出色。实测中,该模型迅速解答了复杂的逻辑推理题,并创作了一篇包含多次反转的悬疑短篇小说,展现了其强大的通用智能。
轻量级的Doubao-1.5-lite在性能上与去年9月的豆包Pro版本相当,意味着企业客户能够以更低的成本获得更出色的性能。多模态能力的全面提升使得豆包在交互和智能表现上更加贴近人类。
视觉理解模型Doubao-1.5-vision-pro在多模态数据合成、动态分辨率等方面进行了全面升级,能够读懂任意分辨率和比例的图片,甚至能够识别并判分手写的试卷。同时,豆包APP已全量上线实时语音功能,支持多种有趣的互动方式。
字节跳动在AI领域的快速发展,不仅体现在技术层面的突破,更在于其市场战略的精准实施。从C端破局,推出覆盖聊天、视频、编程等多领域的AI应用,迅速积累了庞大的用户基础。同时,在B端市场,通过极致优化的模型推理成本,成功攻入企业市场,提升了火山引擎在云服务市场的地位。
火山引擎抓住“大模型+云厂商”的热浪,推出了包括火山方舟、扣子、HiAgent等一系列平台和服务,为企业落地大模型、打造AI应用提供了全周期的支撑。截至2024年12月中旬,豆包大模型的日均Token使用量已超过4万亿,已在金融、消费、电商等多个行业完成落地,与八成主流汽车品牌合作,并接入到多家智能终端,覆盖设备约3亿台。
随着大模型厂商的分化逐渐明朗,能够继续迭代基础模型并有望实现商业化盈利的厂商数量有限。模型能力始终是核心竞争力,而AI所需的庞大资金投入与极少盈利回报之间的矛盾也日益凸显。对字节跳动而言,豆包大模型1.5 Pro的顶尖表现、C端产品的庞大用户基础以及火山引擎的B端业务突破,为其在AI时代找到了不可替代的位置。