字节跳动豆包视觉模型发布,性价比超高,行业价格直降85%

   发布时间:2024-12-18 16:23 作者:沈瑾瑜

字节跳动在近期举办的火山引擎Force大会上,正式揭晓了其最新的技术成果——豆包视觉理解模型。这一创新方案以极高的性价比吸引了业界的广泛关注,其千tokens输入价格仅为3厘,换算下来,用户仅需一元钱即可处理约284张720P分辨率的图片,这一价格相较于市场平均水平降低了85%。

火山引擎总裁谭待在会上详细介绍了豆包视觉理解模型的强大功能。该模型不仅具备精准的视觉内容识别能力,还展现出了卓越的理解与推理能力。它能够根据图像信息执行复杂的逻辑运算,无论是分析图表、处理代码,还是解答学科问题,都能游刃有余。豆包视觉理解模型还拥有细腻的视觉描述与创作能力,进一步拓宽了其应用场景。

谭待还透露,豆包视觉理解模型已经成功接入豆包App及PC端产品,并且产品团队在多模态输入方面进行了深入的优化,包括语音、视觉等功能的提升,旨在为用户提供更加便捷、高效的输入体验。这些技术成果已通过火山引擎平台向企业客户开放。

与此同时,豆包大模型系列也迎来了多项重要更新。据悉,豆包通用模型pro已经全面对标GPT-4o,并在价格上占据明显优势,仅为后者的八分之一。音乐模型方面,从原先只能生成60秒的简单结构,升级到了能够创作3分钟的完整音乐作品。文生图模型2.1版本更是实现了业界首创,能够精准生成汉字并具备一句话P图的产品化能力,该版本已经成功接入即梦AI和豆包App。

谭待还分享了豆包大模型未来的发展规划。他透露,2025年春季将推出具备更强视频生成能力的豆包视频生成模型1.5版,同时豆包端到端实时语音模型也将很快面世。尽管豆包大模型发布时间相对较晚,但其在技术迭代和进化方面展现出了惊人的速度。

数据显示,截至大会举办时,豆包通用模型的日均tokens使用量已经突破了4万亿,与七个月前首次发布时相比,增长了惊人的33倍。这一数据不仅彰显了豆包大模型的市场潜力,也为其未来的发展奠定了坚实的基础。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群