腾讯近日在深夜里揭晓了一项重要技术进展,自研的深度思考模型——混元T1正式版正式面世。这款模型在多个基准测试中展现出了卓越的推理能力。
在业界公认的评估标准上,混元T1表现尤为亮眼。例如,在大型语言模型评估增强数据集MMLU-PRO中,它取得了87.2分的高分,仅次于顶尖模型o1。在Ceval、AIME以及Zebra Logic等一系列中英文知识及竞赛级数学、逻辑推理的基准测试中,混元T1的成绩同样达到了行业领先的推理模型水平。
腾讯的混元大模型之前已在Chatbot Arena榜单上崭露头角,成功跻身全球前15名。该榜单通过用户匿名与多个模型互动,并根据投票结果生成排名,被视为大模型直接比拼的重要舞台。
追溯至去年9月,腾讯推出了采用MoE架构的新一代大模型混元Turbo,相较于上一代产品,其推理效率提升了一倍,推理成本则降低了50%。这一技术革新为混元T1的推出奠定了坚实基础。
而在本月初,腾讯元宝电脑版App的发布更是内置了混元和DeepSeek两种模型,用户可以在两种模式间自由切换,体验不同模型带来的智能服务。
腾讯在人工智能领域的持续探索和突破,不仅展现了其技术实力,也为行业带来了新的发展动力。随着混元T1的正式推出,未来在更多应用场景中,或将见证更多由腾讯AI技术引领的创新实践。