科大讯飞近日宣布,其星火深度推理模型X1已完成全面升级,并同步推出了基于星火X1的星火医疗大模型X1。这款医疗大模型在诊断推荐、健康咨询等医学领域的应用上,展现出了卓越的性能,树立了新的行业标杆。
尤为星火X1作为国内首个且目前唯一的采用全国产算力训练的深度推理大模型,即便在模型参数量相对较少的情况下,其数学能力依然能够与DeepSeek R1和OpenAI的某型号模型相媲美。此次升级不仅彰显了星火X1的强大实力,也证明了基于国产算力训练的全栈自主可控大模型的巨大潜力。
在首个测试题目中,关于甲、乙两人卡片比赛得分概率的问题,星火X1迅速给出了正确答案,并且解题步骤详尽明了。相比之下,DeepSeek R1则给出了错误答案。在接下来的题目中,星火X1继续保持着稳定的发挥,与DeepSeek R1各有胜负,但星火X1在整体正确率上略胜一筹。
星火X1解答题目1的部分截图
在解题过程中,两款大模型都展现出了类人思考的能力,它们会对题目进行深入分析,明确解题所需的知识点,并详细展示推理逻辑。这种能力不仅有助于用户理解答案,还能让用户知其所以然,从而触类旁通,掌握解决同类问题的方法。
两款大模型还支持识图解题功能,识别率极高。无论是纸质试卷、作业的照片,还是网络截图,都能被轻松识别并解答。这一特点有效解决了数学公式、图形难以用键盘输入的难题,为用户提供了更加便捷、高效的解题体验。
科大讯飞星火深度推理大模型X1之所以能够取得如此优异的成绩,或许与其新增的两大创新技术密不可分。一方面,通过高效的领域数据自动化挖掘和多类型数据合成算法,科大讯飞构建了海量的数学领域预训练数据,从而显著提升了模型的数学专业能力。另一方面,基于评语模型与强化学习算法,科大讯飞实现了大模型长思维链的激发,并促使模型在推理过程中进行反思验证,进一步提高了推理的准确性。
此次星火X1的升级和星火医疗大模型X1的推出,不仅展示了科大讯飞在人工智能领域的深厚积累和创新实力,也为医疗、教育等多个领域的发展注入了新的活力。未来,随着技术的不断进步和应用场景的不断拓展,科大讯飞的大模型产品有望在更多领域发挥重要作用。