腾讯云TI平台新推DeepSeek模型系列:免费体验+一键部署,高效赋能AI应用

   发布时间:2025-02-05 02:28 作者:钟景轩

腾讯云TI平台近日宣布了一项重要更新,正式推出了DeepSeek系列模型,这一举动在AI领域引起了广泛关注。此次上线的模型包括参数量高达671B的DeepSeek-V3和DeepSeek-R1原版模型,以及基于DeepSeek-R1蒸馏技术得到的多个版本,参数规模从70B到1.5B不等。

为了让开发者能够更便捷地体验和使用这些模型,腾讯云TI平台全面支持DeepSeek系列模型的一键部署功能。不仅如此,平台还限时开放了DeepSeek-R1模型的免费在线体验,为开发者提供了一个零门槛的尝试机会。作为企业级机器学习平台,TI平台还提供了包括模型服务管理、监控运营、资源伸缩等一系列功能,旨在帮助企业和开发者将DeepSeek模型高效、稳定地集成到实际业务中。

DeepSeek系列模型自发布以来,便因其卓越的性能而备受瞩目。特别是DeepSeek-R1,这款推理模型在发布时即选择了开源,并在后训练阶段大规模运用了强化学习技术。即便在标注数据极少的情况下,它也能显著提升模型的推理能力。在数学、代码、自然语言推理等多个任务上,DeepSeek-R1的性能已经可以与OpenAI的GPT-1正式版相媲美。

DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。蒸馏后的DeepSeek-R1-Distill系列模型参数规模更小,推理成本更低,同时在基准测试中同样表现出色。而另一款通用模型DeepSeek-V3,在推理速度上相较于之前的模型有了大幅提升,目前在开源模型榜单中名列前茅,与最先进的闭源模型不相上下。

现在,用户只需进入腾讯云TI平台的“大模型广场”,点击DeepSeek系列模型卡片,即可了解模型信息,并进行在线体验和一键部署。为了更直观地展示不同模型之间的性能差异,TI平台还限时免费开放了DeepSeek-R1和DeepSeek-R1-Distill-Qwen-1.5B两款模型的在线体验功能。

通过对比测试,用户可以明显感受到拥有更大参数量的DeepSeek-R1模型在效果上的优势。例如,在回答一个关于物品位置变化的复杂问题时,DeepSeek-R1能够正确推理出杯子倒扣时球会掉出并留在卧室的床上,而参数量较小的DeepSeek-R1-Distill-Qwen-1.5B模型则认为球仍在原来的桌子中。这充分说明了在处理复杂任务时,更大参数量的模型往往更具优势。

对于需要将DeepSeek模型接入AI应用的开发者来说,腾讯云TI平台的一键部署功能无疑是一个巨大的福音。开发者只需在DeepSeek系列模型页面中点击“新建在线服务”按钮,即可快速将模型发布为推理服务。平台支持按量计费和包年包月两种计费模式,开发者可以根据实际需求选择合适的计费方式。

在算力配置方面,腾讯云TI平台也提供了灵活的选择。对于参数量巨大的“满血版”DeepSeek-R1模型,推荐使用两台8卡HCCPNV6机型进行服务部署,以确保业务的稳定性。而对于参数量较小的DeepSeek-R1-Distill系列模型,单张中端GPU卡即可满足部署需求。这大大降低了开发者的部署成本和时间。

除了部署服务之外,腾讯云TI平台还为用户提供了从数据处理、模型训练、模型评测到模型部署的全流程支持。平台内置了多种训练方式和算法框架,可以满足不同AI应用场景的需求。在数据处理层面,TI平台沉淀了来自腾讯优图实验室的优质Pipeline,支持开箱即用。在精调训练阶段,平台内置了主流开源模型,并提供了三层保障机制来确保大规模训练任务的稳定性。在模型评测阶段,平台提供了一整套完善的评测工具,帮助企业全方位验证模型效果。

腾讯云TI平台还完成了对国产计算卡的适配,并支持异构算力的统一纳管。这使得平台能够满足相关企业对安全性和独立性的高标准要求,并帮助客户最大限度整合现有资源。目前,腾讯云TI平台已经在金融、出行、政务、医疗、工业、零售等多个行业落地应用,通过优化AI模型生产流程、提升AI业务运营效率,帮助企业实现降本增效。

 
 
更多>同类内容
全站最新
热门内容
本栏最新