青云科技近期宣布,其旗下的AI算力云服务基石智算CoresHub正式推出了DeepSeek Janus-Pro-7B WebUI版文生图模型。这一创新服务融合了Multimodal Understanding(多模态理解)与Text-to-Image Generation(文本到图像生成)两大功能,用户可通过基石智算的容器实例直接体验。
DeepSeek Janus-Pro是一个统一的多模态理解和生成式MLLM(大规模语言模型),它实现了视觉编码的解耦,从而能够高效处理多模态任务。该模型基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base构建,为多模态理解和图像生成提供了坚实的基础。在多模态理解方面,它采用了SigLIP-L作为视觉编码器,支持384x384的图像输入;而在图像生成方面,则使用了Tokenizer Janus-Series,并支持16的采样率,显著提升了图像质量。
为了便利用户,青云科技提供了详尽的使用指南。用户首先需要登录基石智算的控制台,在“产品与服务”中选择“AI算力云服务”。随后,进入“镜像仓库”,选取DeepSeek镜像中的Janus-Pro-7B,点击“创建容器实例”。在此过程中,用户可以选择单卡4090配置,创建过程预计仅需1分钟,启动WebUI服务同样快速。
启动Janus-Pro-7B WebUI服务后,用户只需点击“更多访问”,并打开9001端口地址即可开始使用。值得注意的是,如果初次打开页面无响应,用户需耐心等待约1分钟,因为服务正在启动中。
在使用DeepSeek Janus-Pro时,用户还可以连接开发环境,模型文件位于/DeepSeek/deepseek-ai/Janus-Pro-7B路径下。这一设置为用户提供了极大的灵活性,便于他们进行算法的二次开发和优化。
基石智算始终致力于打造一个技术领先的AI Infra平台,将AI算力云与模型开发部署服务紧密结合。除了DeepSeek系列模型外,平台还推出了包括文本处理、文生图、文生视频、语音转换等在内的多种模型,支持一键启动、一键部署以及在线微调功能。这些创新服务将助力用户快速打造专属的AI应用,推动AI技术的广泛应用和发展。据悉,DeepSeek-V3、R1系列模型也将陆续上线,敬请期待。