高考数学大比拼：讯飞星火X1升级版与DeepSeek，谁才是解题高手？

发布时间：2025-03-07 23:09 来源：ITBEAR 作者：沈如风

科大讯飞近日宣布，其星火深度推理模型X1已完成全面升级，并同步推出了基于星火X1的星火医疗大模型X1。这款医疗大模型在诊断推荐、健康咨询等医学领域的应用上，展现出了卓越的性能，树立了新的行业标杆。

尤为星火X1作为国内首个且目前唯一的采用全国产算力训练的深度推理大模型，即便在模型参数量相对较少的情况下，其数学能力依然能够与DeepSeek R1和OpenAI的某型号模型相媲美。此次升级不仅彰显了星火X1的强大实力，也证明了基于国产算力训练的全栈自主可控大模型的巨大潜力。

在首个测试题目中，关于甲、乙两人卡片比赛得分概率的问题，星火X1迅速给出了正确答案，并且解题步骤详尽明了。相比之下，DeepSeek R1则给出了错误答案。在接下来的题目中，星火X1继续保持着稳定的发挥，与DeepSeek R1各有胜负，但星火X1在整体正确率上略胜一筹。

星火X1解答题目1的部分截图

在解题过程中，两款大模型都展现出了类人思考的能力，它们会对题目进行深入分析，明确解题所需的知识点，并详细展示推理逻辑。这种能力不仅有助于用户理解答案，还能让用户知其所以然，从而触类旁通，掌握解决同类问题的方法。

两款大模型还支持识图解题功能，识别率极高。无论是纸质试卷、作业的照片，还是网络截图，都能被轻松识别并解答。这一特点有效解决了数学公式、图形难以用键盘输入的难题，为用户提供了更加便捷、高效的解题体验。

科大讯飞星火深度推理大模型X1之所以能够取得如此优异的成绩，或许与其新增的两大创新技术密不可分。一方面，通过高效的领域数据自动化挖掘和多类型数据合成算法，科大讯飞构建了海量的数学领域预训练数据，从而显著提升了模型的数学专业能力。另一方面，基于评语模型与强化学习算法，科大讯飞实现了大模型长思维链的激发，并促使模型在推理过程中进行反思验证，进一步提高了推理的准确性。

此次星火X1的升级和星火医疗大模型X1的推出，不仅展示了科大讯飞在人工智能领域的深厚积累和创新实力，也为医疗、教育等多个领域的发展注入了新的活力。未来，随着技术的不断进步和应用场景的不断拓展，科大讯飞的大模型产品有望在更多领域发挥重要作用。

更多>同类内容