国产大模型首超GPT-4o?李开复:中美差距仅五月!

   发布时间:2024-10-16 19:06 作者:顾雨柔

在近期国内大模型行业暗流涌动之际,零一万物发布全新旗舰模型Yi-Lightning,引起广泛关注。这款模型不仅在国内首次超越GPT-4o,更是在全球范围内追平了Grok,标志着中国大模型技术的重大突破。

LMSYS Org发布的Chatbot Arena测评显示,Yi-Lightning在全球排名第六,中国第一,稳居世界一流大模型公司行列。在中文子榜单上,Yi-Lightning更是超越了xAI的Grok-2-08-13和智谱的GLM-4-Plus等国内外优质模型,与o1-mini等模型并列排名世界第二。

在零一万物的线上发布会中,李开复展示了Yi-Lightning对莎士比亚作品《李尔王》的翻译能力,其在结合上下文、转译微妙语义方面表现突出,展现了出色的中英互通能力。这一表现恰恰与之前的传言相反,证明了预训练的重要性。

此前,国内大模型行业传出风声,部分模型公司因成本高昂打算放弃预训练。对此,李开复在发布会上正式辟谣,表示零一万物将继续坚持预训练,并强调GPT新发布的o1带来了新灵感,即后训练同样重要。然而,这并不意味着要彻底放弃预训练。

在Yi-Lightning的训练过程中,零一万物采用了Mixture of Experts(MoE)混合专家模型架构,并改进了单阶段训练,使用了多阶段的训练模式以及混合注意力机制。这些创新在保持模型性能接近最优的同时,降低了训推成本,提高了推理速度。

对于中国的预训练是否落后美国的问题,李开复表示坦诚中国确实落后,但差距并非十年、二十年。他以GPT4o在5月做出的模型为例,指出零一万物在10月已经将其超越,证明了中国大模型技术的迅速崛起。

在商业化方面,零一万物也在积极探索。自发布千亿参数模型Yi-Large以来,该公司已与阿里云、360、顺丰科技等头部企业达成合作,toB业务不断拓展。同时,针对国内环境,零一万物推出了“AI 2.0”数字人及门店短视频解决方案,以满足零售、电商等行业的需求。

在toC领域,零一万物则主要将目光投向国外市场,尝试推出了一些产品,并取得了一定的成果。考虑到国内用户获取流量成本高昂且流失率无法控制,该公司决定先在国外市场探索toC业务,待时机成熟后再考虑国内市场。

无论是toB还是toC业务,零一万物都始终坚持对模型的追求:性能越强越好,价格越低越好。目前,Yi-Lightning已上线Yi大模型开放平台,每百万token仅需0.99元,直逼行业最低价。对此,李开复表示公司仍有利润空间,欢迎开发者使用。

中国大模型产业已进入到“耐力赛”阶段,如何让大模型赋能千行百业、提升企业新质生产力成为一个重要的命题。这不仅将影响大模型在各个具体行业里的未来发展方向,甚至可能改变世界的创新版图。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群