全球AI大模型Token调用量逆转谁在为算力涨价买单？

当前位置：首页>双鸭山>全球AI大模型Token调用量逆转谁在为算力涨价买单？

全球AI大模型Token调用量逆转谁在为算力涨价买单？

发布时间：2026-04-23 来源：粘皮带骨网作者：激情释放12

连涨十周之后，全球AI（人工智能）大模型的Token（词元）调用量踩了刹车。

《每日经济新闻》记者根据OpenRouter（目前全球最大AI模型应用程序编程接口聚合平台）最新数据测算，4月13日至19日全球AI大模型总调用量为20.6万亿Tokens，连续两周走低。

值得注意的是，上榜的AI大模型中，中国AI大模型周调用量环比下跌23.77%至4.44万亿Tokens，而美国AI大模型周调用量环比增长20.62%至4.91万亿Tokens，近两个月来首次反超。

这场逆转，与一轮席卷全球的算力涨价潮高度吻合。

转折点源于算力成本上涨

全球调用量从连涨十周到转头向下，转折点源于全球性的算力成本上涨。

自3月以来，以阿里云、腾讯、百度为代表的云厂商相继上调大模型相关服务价格。

4月8日，智谱发布GLM-5.1的同时再度提价10%，从而完成今年第三次调价。

海外AI巨头Anthropic同样调整了定价策略，将旗下企业级产品Claude Enterprise的订阅模式从每月每用户最高200美元固定费用改为按实际算力消耗计费，另加每月20美元固定费。

这意味着，轻度用户月费可能有所下降，但重度用户反而更贵。软件授权谈判协助公司Redress Compliance联合创始人Fredrik Filipsson表示，新定价可能导致重度用户成本翻倍甚至3倍。

国产模型产品力迎大考

“Token资费普遍上涨，成本增高，用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者，当价格优势不再突出，模型的产品力便成为左右用户选择的关键。

胡延平分析，上周美国AI大模型调用量回升，主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”，而国产大模型在这方面的产品力仍需提升。

OpenRouter数据显示，上周，Claude Sonnet4.6冲上榜首，周调用量达1.38万亿Tokens，环比增长19%。Claude Opus4.6位居第三，周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。

与此形成对比的，是近期国产模型的过山车行情。

在此前一周（4月6日至12日），阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首，但仅过一周（4月13日至19日）便下滑出榜单。

此外，记者注意到，此前多次上榜的Kimi K2.5、智谱GLM系列模型，已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash，近两周同样无缘榜单。

胡延平认为，OpenRouter平台的用户以开发者和中小企业为主，对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向，在能够触达的范围内，用户只用最好的。”他指出，用户场景越来越要求模型具备强工具调用能力、多Agent（智能体）支持、长程复杂任务的持续达成能力，目前OpenRouter上的大部分模型在这方面还需着力提升。

有业内人士也向《每日经济新闻》记者指出，算力成本上涨后，行业内普遍优先选择性能稳定、输出效果可靠的工具，价格已非首要考量。

消耗量仍处快速增长通道

短期数据波动是否意味着AI应用热潮正在消退？

“短期还不宜下结论。”胡延平提醒，OpenRouter的Token调用量仅占全球消耗总量的2%~4%，其排名波动更多反映的是开源、二线及新发模型的竞争态势，不能代表整个市场的走向。

事实上，成本压力正在倒逼市场进化。胡延平观察到，今年初以来，OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平。成本大幅抬高，促使企业和用户转而采用记忆优化、提示词压缩等手段主动降耗。

记者了解到，甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量阶段，进化到追求更高投入产出比的提效阶段。

更深层的变化在于AI应用场景本身的质变。国联民生证券一份研报提出“Token通胀”的概念。这并非指Token本身变贵，而是指单位时间内，单位用户的Token消耗结构性上升。

用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的流量，而是执行生产任务时必不可少的燃料。

摩根大通在研报中对中国市场作出极为乐观的预测，预计2025年至2030年，中国Token消耗量的年复合增长率将达330%，5年内将实现370倍增长。

胡延平同样对长期趋势保持乐观态度：“就中长期而言，无论OpenRouter上的统计数据如何波动，包括中国在内，全球Token消耗总量都处在快速增长通道，未来两三年会有数十倍甚至数百倍的增加。”

眼下的调用量下滑，或许只是价格冲击下的一次短暂换仓。真正的问题不是AI热潮是否消退，而是当Token从免费试用走向真实定价，谁的模型经得起市场用真金白银来投票。

上一篇：{loop type="arclist" row=1 }{$vo.title}

全球AI大模型Token调用量逆转 谁在为算力涨价买单？

全球AI大模型Token调用量逆转谁在为算力涨价买单？