在近日举办的2024开放原子开发者大会及首届开源技术学术大会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏发表了重要讲话。他强调,腾讯已将开源协同作为核心战略,致力于推动内外部技术的开源共享。
据刘煜宏介绍,腾讯混元大模型系列中的多个模态模型,包括语言大模型、文生图大模型、文生3D大模型以及文生视频大模型,均已实现开源。这一举措不仅展示了腾讯在AI领域的深厚积累,也体现了其对开源社区的积极贡献。未来,腾讯还将进一步开源更多版本的大模型,与社区开发者携手共进,共同推动技术生态的繁荣发展。
腾讯混元大模型的开源成果得到了开源社区的广泛认可。其模型性能卓越,总GitHub Star数量已接近1.4万颗,并多次登上趋势榜。其中,文生图大模型在国内外衍生出1600多个版本,GitHub Star超过3700,吸引了数千名核心开发者参与。腾讯混元large模型在开源后的短短五天内,便在HugginFace百万模型中脱颖而出,登上趋势榜榜首,GitHub Star达到1300。
腾讯混元3D模型同样表现出色,GitHub Star达到2500,开源两周内便成为HuggingFace下载增速最快的3D模型。文生视频大模型更是备受瞩目,GitHub Star已超过6300,发布后迅速登上开源趋势热榜。社区开发者基于腾讯混元的开源模型,主动改进了多个衍生版本,进一步丰富了模型的应用场景。
在2024年这一大模型技术持续爆发的年份,腾讯不仅坚持全链路自研的大模型研发路线,还通过积极开源,将成熟的技术与社区共享。5月,腾讯混元文生图大模型全面升级并率先对外开源,成为业内首个中文原生的DiT架构文生图开源模型。评测数据显示,该模型效果远超开源的Stable Diffusion模型,整体能力属于国际领先水平。
11月,腾讯混元再次宣布最新的MoE模型“混元Large”以及混元3D生成大模型“ Hunyuan3D-1.0”开源。这两个模型均属腾讯自研,在架构、算法、数据等方面有独特创新,填补了行业空白。其中,混元Large是当时开源领域参数规模最大、效果最好的MoE模型;而混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。
12月,腾讯混元生成视频大模型也宣布开源,参数量达到130亿,是当前最大的视频开源模型。开源内容包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这一举措将极大地降低开发者及企业的应用门槛,加速行业创新步伐。
在本届大会上,腾讯还积极参与了数据库开源专题论坛和大模型开源专题论坛,与众多开发者分享了腾讯在数据库和大模型上的技术历程。通过代码的开源和协作,腾讯持续推动技术高效创新、开放共享。
腾讯在开源领域的贡献远不止于此。早在2010年,腾讯就开始在公司层面推动外部开源工作的开展。如今,腾讯已经由最初的开源使用者转变为开源项目的核心贡献者。作为开放原子的发起单位之一,腾讯自基金会成立以来便积极参与开源,捐赠了操作系统、编译器、数据库等核心项目。
随着开源成为全球技术发展的主流趋势,基于全球开发者众研众创的开源生态正加速形成。腾讯将继续秉持开源协同的理念,与技术社区共同成长,推动技术进步。