最高涨价463% 你的AI员工变贵了 内幕曝光简直太意外了
2026-04-10 12:23:294月8日,智谱公布了今年以来的第三次提价计划,发布新一代旗舰模型GLM-5.1的同时提价10%,而其距离上次调价30%起仅一个月。
但除智谱外,腾讯、阿里等也接连停止免费公测,提高API调用价格,其中,腾讯混元大模型最高涨价463%。与2025年降价、免费试用相对,目前明显的信号是,国产AI大模型正在进入集体涨价的时代。

Token变得更加紧俏。对于普通用户而言,能直观感受到的是免费额度正在收紧。大模型Chat产品开始限制提问次数以及附件识别字符,“7.9元”、“一杯奶茶钱”等尝鲜宣传的首月优惠套餐也逐步悄然下架。
对于开发人员而言,各家大模型API调用价格都在上涨,Coding Plan是更具性价比的选择,但其具体额度消耗标准也在出现变化,从以prompt次数为基准转向以模型调用次数或Token为计费基准。
Prompt意味着一次提示指令,即给AI传达的一次任务,而一次指令通常会触发多次模型调用。以阿里云百炼提供的信息作为参考,简单任务约消耗5~10次,复杂任务约10~30+次,实际消耗受任务难度、上下文及工具使用影响。
特别是在Agent场景中。智谱CEO张鹏此前在中关村论坛上表示,完成一个Agent任务所需要的Token量,可能是回答一个简单问题时的十倍甚至百倍。
大模型商们把账算得更细了,要求用户需要对更高水平的“数字员工”支付匹配的价格。1月30日,Kimi公布称Coding plan将从基于prompt请求切换至基于Token计费方式;3月20日,阿里云百炼暂停Lite套餐订购;3月23日,Minimax也将Prompt基准改为模型调用次数。
Coding plan甚至一度出现“限购”现象,智谱从1月下旬便公告称将试行限量发售GLM Coding Plan,限售后每日可销售量降为当前的20%,引发用户蹲点抢购。但这也许并不是大模型商们的饥饿营销,而是算力突发告急。
涨价潮正在向上游AI算力层蔓延。4月9日,腾讯云公告将于2026年5月9日起进行调价,AI算力相关产品服务费用上调5%;容器服务TKE-原生节点相关产品服务费用上调5%;弹性MapReduce(EMR)相关产品服务费用上调5%。