在人工智能技术的广阔天地中,深度学习框架扮演着举足轻重的角色,它既是多样化算力的赋能者,也是各类算法模型孕育的摇篮,对推动大模型产业的发展不可或缺。在全球范围内,TensorFlow和PyTorch早已占据了领先地位,而在中国市场,这一格局正在被华为昇思MindSpore和百度飞桨PaddlePaddle等本土力量悄然改变。
近日,在昇思人工智能框架峰会上,一个令人瞩目的消息传来:18家单位联合发布了基于昇思的原生开发大模型成果,标志着昇思在大模型领域的布局已初见成效。据业内预测,到2024年,中国AI框架的新增市场份额中,昇思将占据高达30%的比例。
华为ICT战略与业务发展部总裁彭红华在会上强调,人工智能框架是AI时代的操作系统和软件基石,一个领先的AI框架必须同时具备高效、敏捷和开放的技术与生态能力。华为将持续加大对昇思MindSpore的投入,通过开源的方式,推动中国人工智能框架生态的健康、高速发展。
智谱AI CEO张鹏在会上分享了他的见解。他指出,随着算力问题的逐渐缓解,当前行业面临的主要挑战是如何高效利用硬件资源,而这离不开AI大模型训练的框架和基础设施。昇思在这方面做了大量工作,智谱也与其合作增强了分布式并行的能力,实现了从训练到推理的一致性和部署可用性。更重要的是,昇思突破了核心技术,掌握了全栈自主创新的能力。
张鹏还透露,智谱从2020年就开始与国产生态进行合作,其中包括昇腾系列硬件,结合昇思MindSpore进行国产大模型训练。他们的明星产品CodeGeeX就是在这样的合作中诞生的,经过多次迭代,已经发展成为业界领先的模型。
昇思MindSpore开源社区理事长丁诚在会上也提到了大模型技术的演进趋势。他指出,大模型的参数量、序列长度和模态结构正在以指数级速度增长,这对深度学习框架提出了新的挑战。同时,随着Open AI发布o1模型,计算过程从单任务、单模型走向了多任务、多模型,深度学习和强化学习相融合的方式,这对深度学习框架也提出了新的要求。
开源是昇思快速追赶先进框架的重要策略。昇思从社区论坛收集了大量的技术问题,并针对性地进行技术预研和规划。中国工程院院士何友表示,昇思作为自主创新的AI框架,在大模型时代的开源实践尤为重要,其某些指标甚至可以与国际领先水平相媲美。
据现场公布的数据显示,自2020年开源以来,昇思MindSpore已经孵化、支持了50多个国内外主流大模型;开源版本已累计获得1100万次下载,覆盖了全球130多个国家和地区的2400多个城市;3.7万多名开发者参与了社区贡献。昇思还与360多所高校科研院所展开教学及科研合作,联合1700多位生态伙伴打造了超过2000个解决方案。
PaperwithCode网站显示,基于昇思发表的原创论文数量已累计超过1700篇,位列全球第二、中国第一。这些数据无疑为昇思在中国乃至全球AI框架市场中的地位提供了有力的支撑。