阿里云蝶变:从云计算到AI,阿里如何重掌未来之钥?

   发布时间:2025-03-11 19:05 作者:钟景轩

在近日于迪拜举办的World Governments Summit 2025峰会上,阿里巴巴董事局主席蔡崇信宣布了一项震撼业界的消息:苹果已选定阿里巴巴作为其在中国市场的本地化合作伙伴。蔡崇信进一步透露,双方的合作范围不仅限于手机服务,未来还将扩展至更多业务板块。

此次合作的背后,一个不可忽视的主角是“阿里云”。尽管在过去,相比于淘宝、天猫和菜鸟,阿里云在公众视野中往往处于较为次要的位置,但如今,这一局面正在发生显著变化。

时间回溯到2009年,当马云与阿里云研发团队合影留念时,标志着阿里巴巴正式进军云计算领域。在随后的日子里,这群年轻人在一间简陋的办公室中,敲下了阿里云计算操作系统“飞天”的第一行代码。

阿里云成立之初,首要任务是解决公司的底层能力扩容问题。随着用户数量和交易频次的高速增长,淘宝与支付宝的服务器多次濒临崩溃边缘。若不及时采取行动,剩余空间将很快耗尽,服务器将频繁宕机。作为承载海量交易数据的电商平台,若服务器算力受限,将严重制约平台自身的商品信息与交易承载量,成为制约阿里增长的瓶颈。

更为紧迫的是,当时阿里采用的IOE架构已无法满足日益增长的算力需求。IOE包括服务器供应商IBM、数据库供应商Oracle和存储供应商EMC。尽管这些海外成熟的系统设备对于普通公司业务绰绰有余,但对于阿里来说却显得捉襟见肘。IOE扩容需要购买大量昂贵的硬件和软件,且未来维护费用高昂。更重要的是,这些外国系统从未承载过阿里当时上亿的用户量。

马云意识到问题的严重性,决定自力更生。他从微软亚洲研究院挖来了曾担任过副院长的王坚博士。王坚为马云算了一笔账:如果不搞云计算新架构,光买IOE软硬件就能让阿里破产。于是,阿里云开始与时间赛跑。

然而,这条道路并不平坦。2009年,作为阿里云“飞天”系统首席架构师的王坚启动了“云梯计划”,以证明云计算替代IOE的可行性。然而,阿里云代码还未编写多少,阿里技术部门的八十多位工程师就表示反对。因为此时无论是“云梯1”还是“云梯2”都只是半成品,无法有效替换现有系统。

为了说服工程师放弃Oracle转投“飞天”,阿里云选择了“三年期限,新架构下淘宝核心交易系统必须零故障”的超级赌约。然而,在2009年深秋,当阿里Oracle工程师们亲手拆掉自己熟悉的系统时,却未能等来想象中的顺畅升级。淘宝与阿里金融在率先接入“飞天”后表示,新系统难用且算力危机并未得到明显改善。

直到2010年春节过后,阿里云经历了一次重大版本升级,局势才暂时稳定下来。然而,“云梯计划”尚未分晓,淘宝与阿里金融在公司内部看来也是“被迫与阿里云握手”。想要真正成为阿里各项业务通用的大数据计算平台,“飞天”必须突破“5K瓶颈”,即拥有独自调度5000台服务器的能力。

从2010年到2012年,阿里云全团队没日没夜地加班都未能突破这一瓶颈。在几乎尝试了一切能想到的技术策略后,王坚与团队陷入了绝望。阿里云在公司内部遭受巨大非议,被称为“骗子”,质疑其技术和管理能力。每年公司内部比拼,阿里云稳拿倒数第一,核心团队出走,部门离职率高达70%。

在2011年底,时任阿里金融总裁的胡晓明一度忍无可忍地带着团队冲到王坚办公室,发出了最后的通牒。然而,马云对阿里云充满信心,表示每年将投入10个亿,投个十年,做不出来再说。在马云的支持下,流言蜚语终才平息。

时间步入2013年,两架云梯依旧未能突破“5K瓶颈”。然而,更坏的消息出现了:集团技术保障部表示,按照当下业务增长趋势,两架云梯系统的储存与算力将在当年6月到顶。阿里云面临背水一战,最终决定倾尽所有资源与时间,全力让自主的“飞天”架构飞跃5K大关。

在服务器快要到顶的最后关头,2013年6月,阿里云终于突破5K瓶颈,自研的飞天系统完成了最后的考验。王坚感慨:“阿里云是拿命换来的”。这一突破意味着阿里在云计算能力、性能和架构等方面达到了全球领先水平,阿里云也成为了中国真正意义上的第一家云计算企业。

此后,阿里云制定了全新战略,用技术拓展商业边界,用商业推动技术发展。其核心正如马云要求的那样:便宜、好用。作为国内最早有能力提供云计算服务的互联网公司,阿里云敏锐地察觉到中国正在进入数字化转型的探索时期,决定全面拥抱这波数字化浪潮。

阿里云用性价比收获了一大批初创公司的订单,并陪伴了一批新兴巨头的成长。其中,字节跳动的崛起尤为典型。随着今日头条、抖音等明星产品的接连出现,字节服务器在短期内难以承接数亿级的新用户涌入。这时,只有阿里云能填补上如此庞大的算力与储存缺口。作为字节崛起之路上的“卖铲人”,阿里云获得了丰厚回报。

在先发优势与资源优势的双加持下,2014年至2019年间的阿里云在中国几乎没有对手。然而,随着国内云市场的蓬勃发展,阿里云也持续面临被分蛋糕的挑战。天翼云、移动云、联通云等“运营商云”国家队的出现,以及华为云、腾讯云、京东云的持续发力,让阿里云面临巨大压力。

尽管如此,阿里云并未停滞不前。近年来,阿里云加快了走进AI时代的步伐。2019年,阿里云开始研究布局Qwen大模型,并因此取得了显著成果。在最新的大模型盲测榜单中,阿里云的Qwen2.5-Max以高分位列全球第七名,成为非推理类的中国大模型冠军。

阿里云是国内最早也是唯一开源自研大模型的“大厂”,也是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商。其开源的Qwen系列大模型已成为国内外最火的产品之一,全球衍生模型数量位列第一。

阿里云不仅拥抱开源、开放共赢,也没有忘记“便宜、好用”的初心。随着Qwen系列主力模型的大幅降价,阿里云进一步刺激了开发者和各行各业客户使用大模型的需求。同时,阿里云也在积极推动AI在内部业务中的转型和应用。

阿里巴巴CEO吴泳铭透露,阿里已经看到了内部应用和AI相结合的多方面机会。无论是淘天、夸克还是钉钉等业务部门,都将会在AI的重塑下获得新发展空间。阿里云企业级大模型开发平台“百炼”已集成国内外两百多款大模型API,进一步降低模型调用成本。

 
 
更多>同类内容
全站最新
热门内容
本栏最新