设为首页加入收藏
  • 首页
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
    • 当前位置:首页>双鸭山>全球AI大模型Token调用量逆转 谁在为算力涨价买单?

      全球AI大模型Token调用量逆转 谁在为算力涨价买单?

      发布时间:2026-04-23 来源:粘皮带骨网作者:激情释放12

      连涨十周之后,全球AI(人工智能)大模型的Token(词元)调用量踩了刹车。

      《每日经济新闻》记者根据OpenRouter(目前全球最大AI模型应用程序编程接口聚合平台)最新数据测算,4月13日至19日全球AI大模型总调用量为20.6万亿Tokens,连续两周走低。

      值得注意的是,上榜的AI大模型中,中国AI大模型周调用量环比下跌23.77%至4.44万亿Tokens,而美国AI大模型周调用量环比增长20.62%至4.91万亿Tokens,近两个月来首次反超。

      这场逆转,与一轮席卷全球的算力涨价潮高度吻合。

      转折点源于算力成本上涨

      全球调用量从连涨十周到转头向下,转折点源于全球性的算力成本上涨。

      自3月以来,以阿里云、腾讯、百度为代表的云厂商相继上调大模型相关服务价格。

      4月8日,智谱发布GLM-5.1的同时再度提价10%,从而完成今年第三次调价。

      海外AI巨头Anthropic同样调整了定价策略,将旗下企业级产品Claude Enterprise的订阅模式从每月每用户最高200美元固定费用改为按实际算力消耗计费,另加每月20美元固定费。

      这意味着,轻度用户月费可能有所下降,但重度用户反而更贵。软件授权谈判协助公司Redress Compliance联合创始人Fredrik Filipsson表示,新定价可能导致重度用户成本翻倍甚至3倍。

      国产模型产品力迎大考

      “Token资费普遍上涨,成本增高,用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者,当价格优势不再突出,模型的产品力便成为左右用户选择的关键。

      胡延平分析,上周美国AI大模型调用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”,而国产大模型在这方面的产品力仍需提升。

      OpenRouter数据显示,上周,Claude Sonnet4.6冲上榜首,周调用量达1.38万亿Tokens,环比增长19%。Claude Opus4.6位居第三,周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。

      与此形成对比的,是近期国产模型的过山车行情。

      在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首,但仅过一周(4月13日至19日)便下滑出榜单。

      此外,记者注意到,此前多次上榜的Kimi K2.5、智谱GLM系列模型,已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash,近两周同样无缘榜单。

      胡延平认为,OpenRouter平台的用户以开发者和中小企业为主,对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向,在能够触达的范围内,用户只用最好的。”他指出,用户场景越来越要求模型具备强工具调用能力、多Agent(智能体)支持、长程复杂任务的持续达成能力,目前OpenRouter上的大部分模型在这方面还需着力提升。

      有业内人士也向《每日经济新闻》记者指出,算力成本上涨后,行业内普遍优先选择性能稳定、输出效果可靠的工具,价格已非首要考量。

      消耗量仍处快速增长通道

      短期数据波动是否意味着AI应用热潮正在消退?

      “短期还不宜下结论。”胡延平提醒,OpenRouter的Token调用量仅占全球消耗总量的2%~4%,其排名波动更多反映的是开源、二线及新发模型的竞争态势,不能代表整个市场的走向。

      事实上,成本压力正在倒逼市场进化。胡延平观察到,今年初以来,OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平。成本大幅抬高,促使企业和用户转而采用记忆优化、提示词压缩等手段主动降耗。

      记者了解到,甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量阶段,进化到追求更高投入产出比的提效阶段。

      更深层的变化在于AI应用场景本身的质变。国联民生证券一份研报提出“Token通胀”的概念。这并非指Token本身变贵,而是指单位时间内,单位用户的Token消耗结构性上升。

      用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的流量,而是执行生产任务时必不可少的燃料。

      摩根大通在研报中对中国市场作出极为乐观的预测,预计2025年至2030年,中国Token消耗量的年复合增长率将达330%,5年内将实现370倍增长。

      胡延平同样对长期趋势保持乐观态度:“就中长期而言,无论OpenRouter上的统计数据如何波动,包括中国在内,全球Token消耗总量都处在快速增长通道,未来两三年会有数十倍甚至数百倍的增加。”

      眼下的调用量下滑,或许只是价格冲击下的一次短暂换仓。真正的问题不是AI热潮是否消退,而是当Token从免费试用走向真实定价,谁的模型经得起市场用真金白银来投票。

      • 上一篇:{loop type="arclist" row=1 }{$vo.title}