在科技界的瞩目下,字节跳动于近日举行的“2024火山引擎FORCE原动力大会•冬”上,震撼发布了其最新的豆包视觉理解模型。这一发布不仅标志着豆包在性能上的显著提升,更以令人咋舌的价格策略,再次掀起了业界的波澜。
据大会透露,豆包视觉理解模型自今年5月首次亮相以来,便以远低于行业平均水平的价格,引领了一场“降价潮”。而此次,字节跳动更是将价格压低至3厘/千tokens,这意味着用户仅需1元即可处理多达284张720P的图片,相较于行业平均价格,降幅高达85%。如此低廉的价格,使得多模态模型的价格正式迈入“厘时代”。
火山引擎总裁谭待在发布会上表示,视觉是人类理解世界的重要方式,对于大模型而言同样如此。豆包视觉理解模型不仅具备卓越的内容识别、理解和推理能力,还能进行复杂的视觉描述和创作。发布会现场播放的演示视频,更是直观地展示了该模型在识别物体、解释图片、分析图表、处理代码以及提供个性化建议等方面的强大功能。
面对外界关于“价格战”的质疑,抖音集团副总裁李亮在微博上直接回应称,这并非价格战,而是豆包大模型通过技术创新降低成本的必然结果。李亮透露,豆包大模型在算法、软件工程和硬件方案上进行了大量优化,使得3厘/千tokens的定价依然能够保持可观的毛利。他强调,这是豆包一步到位的透明价格,没有复杂的折扣和附加条件。
谭待在发布会后接受采访时进一步指出,豆包大模型的算力储备充足,且在工程技术上进行了大量优化,这使得豆包能够大规模、低价格、高吞吐地承接业界服务。他相信,豆包视觉理解模型的推出,将极大地拓展大模型的应用场景边界,为更多行业企业提供具有性价比的多模态大模型能力。
在B端市场上,豆包大模型已经取得了显著的成果。目前,豆包已与八成主流汽车品牌合作,并接入多家手机、PC等智能终端,覆盖终端设备约3亿台。来自智能终端的豆包大模型调用量在半年时间内增长了100倍。还有报道称苹果公司正与字节跳动商谈将豆包大模型整合到在中国销售的iPhone中,虽然这一消息尚未得到字节跳动的正式回应,但已经引起了资本市场的广泛关注。
谭待还提到,大模型在B端和C端获客上不再割裂,而是齐头并进。他解释说,大模型的C端和B端背后都是同一个东西——模型本身。因此,他有时会建议企业CEO直接下载豆包App试用,以便更好地想象哪些企业场景需要大模型的应用。
随着“百模大战”的深入,变现压力逐渐显现,国内大模型产品在B端、C端获客上的竞争也日趋激烈。然而,谭待对此却显得颇为淡然。他认为,目前大模型市场还处于非常早期的阶段,可能只开发出了千分之一的潜力。因此,他更关注如何把自己的东西做好、把成本做低、把方案的落地应用性做好,让企业和用户真正能用起来。
在谭待看来,豆包的竞争对手们也在大力投入,坚定追逐多模态。然而,他并不担心竞争,因为他相信豆包凭借自身的优势和创新能力,能够在激烈的市场竞争中脱颖而出。