連漲十週後接連兩週下滑!全球 AI 大模型 Token 調用量逆轉,誰為算力漲價買單?

記者|宋欣悅

編輯|金冥羽、楊軍、杜波

校對|張錦河

在連續上漲十週之後,全球 AI 大模型的 Token(詞元)調用量終於踩下煞車。

《每日經濟新聞》記者根據 OpenRouter(目前全球最大的 AI 模型 API 聚合平台,擁有超過 500 萬開發者用戶,其 API 調用量數據被業界視為 AI 應用落地的「晴雨表」)的最新數據測算,上週(4 月 13 日至 19 日)全球 AI 大模型總調用量為 20.6 兆 Token,已連續兩週走低。

值得注意的是,在上榜的 AI 大模型中,中國 AI 大模型的週調用量環比下跌 23.77%,降至 4.44 兆 Token;反觀美國 AI 大模型週調用量則環比增長 20.62%,達到 4.91 兆 Token,近兩個月來首次實現反超。這場逆轉,與近期席捲全球的算力漲價潮高度吻合。

全球 AI 大模型調用量趨勢圖

轉折點源於全球性算力成本上漲

根據 OpenRouter 最新數據測算,上週全球 AI 大模型總調用量為 20.6 兆 Token,在連續十週上漲後,接連兩週出現下滑。其中,中國 AI 大模型週調用量下滑至 4.44 兆 Token,較前一週大幅減少 23.77%;而美國 AI 大模型週調用量則達 4.91 兆 Token,環比增長 20.62%,近兩個月來首次超越中國。

中美 AI 模型調用量對比圖

全球調用量從連漲十週到轉頭向下,關鍵轉折點在於全球性的算力成本上漲。自 3 月以來,包含阿里雲、騰訊、百度等在內的雲端服務廠商相繼調漲大模型相關服務價格。

4 月 8 日,智譜 AI 在發布 GLM-5.1 的同時,再度調漲價格 10%,完成今年以來的第三次調價。調價後,GLM-5.1 在程式編寫(Coding)場景下的緩存命中 Token 價格,已接近 Anthropic 旗下 Claude Sonnet 4.6 的水準,標誌著國產大模型首次在核心應用場景實現與海外領先者的價格接軌。

海外 AI 巨頭 Anthropic 同樣調整了定價策略,將旗下企業級產品 Claude Enterprise 的訂閱模式,從「每用戶每月最高 200 美元的固定費用」改為「按實際算力消耗計費,另加每月 20 美元固定費」。

這意味著,輕度用戶的月費可能有所下降,但重度用戶的成本反而更高。軟體授權談判協助公司 Redress Compliance 聯合創辦人 Fredrik Filipsson 表示,新定價方案可能導致重度用戶的成本翻倍甚至達到三倍。

AI 模型定價策略調整示意圖

國產模型「產品力」迎來大考

「Token 資費普遍上漲,成本增高,用戶不得不控制總量以節約成本。」上海財經大學特聘教授胡延平告訴《每日經濟新聞》記者,當價格優勢不再突出時,模型的產品力便成為左右用戶選擇的關鍵。

胡延平分析,上週美國 AI 大模型調用量回升,主要由 Anthropic 旗下的 Claude Sonnet 和 Opus 模型拉動。這兩款模型已成為程式編寫(Coding)領域的「硬通貨」,而國產大模型在這方面的產品力仍有待提升。

OpenRouter 數據顯示,上週 Claude Sonnet 4.6 衝上榜首,週調用量達 1.38 兆 Token,環比增長 19%;Claude Opus 4.6 位居第三,週調用量達 1.22 兆 Token。僅这两款模型合計就佔美國 AI 大模型週調用量的五成以上。

Claude 系列模型調用量增長圖表

與此形成對比的,是近期國產模型的「過山車」行情。

在此前一週(4 月 6 日至 12 日),阿里 Qwen3.6 Plus 以 1.66 兆 Token 的週調用量位居全球榜首,但僅過了一週(4 月 13 日至 19 日)便下滑出局。

此外,記者注意到,此前多次上榜的 Kimi K2.5、智譜 GLM 系列模型,已連續三週未登榜;此前一度衝上榜单第二的階躍星辰 Step 3.5 Flash,近兩週同樣無緣榜單。

胡延平認為,OpenRouter 平台的用戶以開發者和中小企業為主,對模型的迭代能力和垂直場景產品力要求極高。「市場用戶有往頭部主力模型集中的趨勢,在能夠觸及的範圍內,用戶只用最好的。」他指出,用戶場景越來越要求模型具備強大的工具調用能力、多 Agent 支援能力,以及長程複雜任務的持續達成能力,「目前 OpenRouter 上的大部分模型在這方面還需著力提升」。

也有業界人士向《每日經濟新聞》記者指出,在算力成本上漲後,行業內普遍優先選擇性能穩定、輸出效果可靠的工具,價格已非首要考量。

國產模型市場表現波動圖

專家:全球消耗量仍處快速增長通道

短期數據波動,是否意味著 AI 應用熱潮正在消退?

「短期還不宜下結論。」胡延平提醒,OpenRouter 的 Token 調用量僅占全球消耗總量的約 2% 至 4%,其排名波動更多反映的是開源、二線及新發模型的競爭態勢,並不能代表整個市場的走向。

事實上,成本壓力正在倒逼市場進化。胡延平觀察到,今年初以來,OpenClaw 等各類智能體、多 Agent 應用已將 Token 調用量拉升至去年底的兩三倍水準;成本大幅抬高,促使企業和用戶轉而採用記憶優化、提示詞壓縮、約束工程(Harness Engineering)等手段主動降耗。

記者了解到,甚至有中小創業者已將 Token 使用量納入員工績效考核。市場正從單純追求數量的「堆量」階段,進化到追求更高投入產出比的「提效」階段。

更深層的變化,在於 AI 應用場景本身的本質轉變。國聯民生證券一份研究報告中提出了「Token 通脹」的概念。這並非指 Token 本身變貴,而是指單位時間內、單位用戶的 Token 消耗結構性上升。

用戶的需求正從淺層的「問答」轉向深度的「幹活」。Token 不再是傳統網際網路時代邊際成本幾乎為零的「流量」,而是執行生產任務時必不可少的「燃料」。

摩根大通在研究報告中對中國市場作出極為樂觀的預測,預計 2025 年至 2030 年,中國 Token 消耗量的年複合增長率將達 330%,5 年內將實現 370 倍增長。

胡延平同樣對長期趨勢保持堅定樂觀:「就中長期而言,無論 OpenRouter 上的統計數據如何波動,包括中國在內,全球 Token 消耗總量都處在快速增長通道,未來兩三年會有數十倍甚至數百倍的增加。」

眼下的調用量下滑,或許只是價格衝擊下的一次短暫換倉。真正的問題不是 AI 熱潮是否消退,而是當 Token 從「免費試用」走向「真實定價」,誰的模型經得起市場用真金白銀來投票。

封面圖片來源:每經媒資庫

每經媒資庫圖片

|每日經濟新聞 nbdnews 原創文章|

未經許可禁止轉載、摘編、複製及鏡像等使用

如需請務必向本公眾號後台申請並獲得授權

下載每日經濟新聞 App
相關文章推薦

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.