6月3日零点,腾讯云宣布下调DeepSeek-V4全系大模型调用价格,最高降幅达97.5%,模型性能保持不变。这一举动在AI行业引发强烈反响,大模型推理成本正在以前所未有的速度下降。

价格调整的具体方案覆盖了DeepSeek-V4的全线产品。此次降价的核心逻辑在于智算基础设施的规模化效应和推理效率的持续提升。随着算力中心单机架功率和算力密度的不断增长,以及异构计算架构的优化,单位Token的推理成本已经实现了数量级的降低。

从行业数据来看,AI模型调用量正处于爆发式增长阶段。2024年初中国日均Token消耗量仅为1000亿,到2025年6月底已突破30万亿,一年半时间增长超过300倍。豆包大模型日均Token调用量在2025年12月突破50万亿,同比增长超10倍。累计使用量超万亿Token的企业客户已超过100家。

如此庞大的调用量背后是企业端AI应用的快速渗透。业界预测未来的Token消耗将呈现"二八格局",约80%来自企业应用,20%来自个人用户。降低推理成本对于推动AI在工业制造、金融、医疗等垂直行业的规模化落地至关重要。

腾讯云此次大幅降价,标志着大模型服务正从"能力展示"阶段进入"普惠普及"阶段。对中小企业和独立开发者而言,单位成本的断崖式下降意味着可以用极低的投入验证AI应用场景,这将为AI创业生态注入新的活力。