轮到你了5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时,谈到了大模型的定价策略。
另外以字节内部业务为例,飞书的主要流量高峰在工作时间,抖音在下班后休闲时间的流量更高,这些不同业务的大模型推理,也能根据业务特点错峰使用,就可以降低成本。
对于“大模型开始价格战”的说法,谭待认为,大模型市场仍在发展初期,远远没到激烈竞争的阶段。“池塘有多大,鱼就有多大,现在整个池塘还在培养的过程。”
豆包大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。”
其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。
谭待进一步解释说,豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片,这里有不同的负载,可以把不同任务混合在一起,互相错峰,通过智能调度把它们的利用率都跑得很高,就能极大地提升资源利用率,实现整体成本的优化。
198.13MB
查看638.32MB
查看39.8MB
查看634.47MB
查看268.39MB
查看218.13MB
查看866.28MB
查看566.60MB
查看620.68MB
查看837.89MB
查看274.59MB
查看209.99MB
查看659.66MB
查看153.81MB
查看743.86MB
查看687.45MB
查看773.25MB
查看732.94MB
查看439.99MB
查看169.96MB
查看795.41MB
查看318.16MB
查看120.12MB
查看743.24MB
查看345.94MB
查看728.50MB
查看364.74MB
查看121.91MB
查看642.65MB
查看168.16MB
查看888.25MB
查看975.52MB
查看404.92MB
查看234.11MB
查看251.99MB
查看930.64MB
查看422.31MB
查看984.35MB
查看481.38MB
查看464.84MB
查看805.82MB
查看934.24MB
查看438.90MB
查看140.89MB
查看764.26MB
查看397.35MB
查看159.31MB
查看799.57MB
查看844.54MB
查看871.35MB
查看167.94MB
查看520.48MB
查看410.54MB
查看487.15MB
查看456.88MB
查看507.95MB
查看699.13MB
查看842.77MB
查看757.26MB
查看880.83MB
查看406.39MB
查看937.75MB
查看258.38MB
查看547.10MB
查看907.14MB
查看621.93MB
查看614.51MB
查看944.20MB
查看470.85MB
查看469.44MB
查看364.12MB
查看618.23MB
查看225.18MB
查看937.12MB
查看973.54MB
查看175.79MB
查看445.95MB
查看905.39MB
查看244.85MB
查看905.41MB
查看287.72MB
查看768.91MB
查看849.71MB
查看939.11MB
查看637.26MB
查看785.35MB
查看398.20MB
查看863.33MB
查看137.53MB
查看788.71MB
查看278.24MB
查看832.47MB
查看864.44MB
查看592.92MB
查看315.12MB
查看718.52MB
查看423.70MB
查看902.86MB
查看546.14MB
查看334.37MB
查看131.94MB
查看296.63MB
查看100.87MB
查看623.74MB
查看
536 临江wz
中国记协举办新闻茶座 聚焦新质生产力与中国经济🔑
2025-06-29 06:36:02 推荐
400 188****2269
人民日报社2023年度新闻记者证核验人员名单公示🔕
2025-07-01 20:54:31 不推荐
696 152****5120
献给新年也献给你,记协向新闻媒体征集新年寄语🔙
2025-06-29 02:42:12 推荐
53 霸王龙跑酷
后人类时代的太空史诗——评《宇宙的尽头》三部曲🔜
2025-06-29 08:23:05 推荐