界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪



界面新闻从多个知情人士处获悉,豆包大模型去年大幅降价后,毛利率依然为正。其中字节跳动最新推出的豆包大模型1.5,在推理成本优化上取得进一步突破在火山引擎上售卖API的Doubao-1.5-pro,毛利率50%

去年5字节跳动正式对外发布豆包大模型其中豆包通用模型pro-32k版,模型推理输入百万tokens 0.8元当时市场同规格模型的定价一般为每百万tokens 120元,是豆包模型价格的150倍。

豆包大模型降价之后阿里云通义大模型产品相继调低价格市场一直声音质疑价格大幅降低之后大模型是否赚钱。上述知情人士表示,现在看来这种担心有些多虑

火山引擎总裁谭待此前接受界面新闻采访时,也曾经谈及过模型大幅降价问题在他看来使用量足够大,才能打磨出好模型,也能大幅降低模型推理的单位成本。“大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值,从而催化出超越现有产品和组织模式的创新。

过去一年发展来看豆包通用大模型在市场上的表现一定程度上验证了谭待的判断。

一方面豆包大模型调用量快速增长字节跳动对外公布的数据显示,截至去年12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较首次发布时增长了33倍。



另一方面豆包大模型能力快速提升成本仍在持续降低122字节跳动发布了豆包大模型1.5Pro,性能比之前版本显著增强多项基准测试甚至超过GPT4o,推理成本却大幅降低。据字节跳动官方介绍,豆包1.5采用大规模稀疏MoE架构,性能等效7倍激活参数的稠密模型,远高于业界常规的3倍杠杆。

界面新闻查询火山引擎官网发现Doubao-1.5-pro-32k的百万tokens输入价格仍为0.8元,命中缓存为0.16元,输出价格为2元;轻量化版本Doubao-1.5-lite-32k的百万tokens输入价格0.3元,命中缓存0.06元,输出价格0.6元。两款模型价格在业界同级别最低。

新模型在价格保持不变的同时,随着推理成本持续优化,毛利率也显著增加。一位接近火山引擎的知情人士透露,豆包大模型API之前只能说是有合理毛利率,1.5版的毛利则能达到50%的可观水平。

大模型应用正在向各行各业加速渗透。据字节跳动方面此前公布信息,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。最近个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

上述知情人士透露,由于研发投入巨大,字节的大模型业务仍是亏损状态。只有持续扩大应用侧的模型调用规模,才能长期摊销掉研发成本。

界面新闻字节跳动方面求证上述信息截至发稿对方暂未回应