10 週連続上昇から2 週連続低下へ!世界の AI 大規模モデル、トークン呼び出し量が逆転、AI 演算能力の高騰の代償を誰が払うのか?

記者|宋欣悦

編集|金冥羽 楊軍杜波校正|張錦河

10 週連続で上昇を続けた後、世界の AI 大規模モデルにおけるトークン(単語要素)の呼び出し量にブレーキがかかった。

『毎日経済新聞』の記者が、OpenRouter(現在世界最大の AI モデル API 集約プラットフォーム。500 万人以上の開発者ユーザーを擁し、その API 呼び出し量データは AI アプリケーションの実際の導入状況を示す「景気指標」と見なされている)の最新データに基づき算出したところ、先週(4 月 13 日~19 日)の世界の AI 大規模モデルの総呼び出し量は 20.6 兆トークンとなり、2 週連続で低下した。

注目すべきは、ランクインした AI 大規模モデルのうち、中国の AI 大規模モデルの週間呼び出し量は前週比 23.77%減の 4.44 兆トークンに落ち込んだのに対し、米国の AI 大規模モデルの週間呼び出し量は同 20.62%増の 4.91 兆トークンとなり、ここ 2 ヵ月で初めて中国を抜き返した点だ。この逆転は、世界を席巻する演算能力(コンピューティングパワー)の高騰と完全に一致している。

世界のAIモデル呼び出し量推移を示すグラフ

転換点は世界的な演算コストの上昇に由来

記者が OpenRouter の最新データに基づき算出したところ、先週の世界の AI 大規模モデルの総呼び出し量は 20.6 兆トークンで、10 週連続の上昇後、2 週連続で低下した。その内訳として、ランクインした AI 大規模モデルのうち、中国の AI 大規模モデルの週間呼び出し量は 4.44 兆トークンに下滑し、前週比 23.77%の減少となった。一方、米国の AI 大規模モデルの週間呼び出し量は 4.91 兆トークンで、同 20.62%増加し、ここ 2 ヵ月で初めて中国を抜いた。

中国と米国のAIモデル呼び出し量の比較グラフ

世界の呼び出し量が 10 週連続上昇から一転して下向きに転じた転換点は、世界的な演算コストの上昇に由来する。3 月以来、アリババクラウド(Alibaba Cloud)、テンセント(Tencent)、百度(Baidu)といったクラウド大手が相次いで大規模モデル関連サービスの価格引き上げに踏み切った。

4 月 8 日には、智譜 AI(Zhipu AI)が「GLM-5.1」を発表すると同時に、再度 10%の値上げを実施。これで今年に入り 3 度目の価格改定となった。値上げ後、GLM-5.1 のコーディング(プログラミング)シナリオにおけるキャッシュヒット時のトークン価格は、Anthropic 社傘下の「Claude Sonnet 4.6」の水準に接近。これは、国産大規模モデルが中核的なアプリケーション・シナリオにおいて、初めて海外の有力企業と価格面で並んだことを意味する。

海外の AI 大手である Anthropic 社もまた、価格戦略を調整。傘下の企業向け製品「Claude Enterprise」のサブスクリプション・モデルを、「ユーザー 1 人あたり月額最大 200 ドルの定額制」から、「実際の演算リソース消費量に応じた従量課金+月額 20 ドルの固定費」という方式に変更した。

これは、ライトユーザーの月額料金は下がる可能性がある一方、ヘビーユーザーにとっては逆に高くなることを意味する。ソフトウェアライセンス契約の交渉支援を行う Redress Compliance 社の共同創業者、フレドリック・フィリップソン(Fredrik Filipsson)氏は、「新しい価格体系により、ヘビーユーザーのコストは倍増、あるいは 3 倍になる可能性もある」と指摘する。

AI モデル価格改定の概要を示す図解

国産モデルの「製品力」が正念場へ

「トークン料金の全般的な値上げによりコストが上昇し、ユーザーは総量を抑制してコスト削減を余儀なくされている」。上海財経大学の特任教授である胡延平(フー・ヤンピン)氏は『毎日経済新聞』の取材に対し、価格面での優位性が目立たなくなる中で、モデルの製品力がユーザーの選択を左右する鍵になると語った。

胡氏によると、先週の米国 AI 大規模モデルの呼び出し量回復は、主に Anthropic 社傘下の「Claude Sonnet」と「Opus」モデルに牽引されたという。これら 2 つのモデルは、すでにコーディング(プログラミング)分野における「準通貨」とも言える存在となっており、国産大規模モデルはこの点での製品力向上が依然として課題だと指摘する。

OpenRouter のデータによると、先週は「Claude Sonnet 4.6」が首位に躍り出て、週間呼び出し量は 1.38 兆トークンに達し、前週比 19%増となった。「Claude Opus 4.6」も 3 位につけ、週間呼び出し量は 1.22 兆トークン。この 2 モデルで、米国の AI 大規模モデルの週間呼び出し量の 5 割以上を占める計算だ。

主要 AI モデルの呼び出し量ランキング

これと対照的なのが、ここ最近の国産モデルの「ジェットコースター」のような動向だ。

その前週(4 月 6 日~12 日)には、アリババの「Qwen3.6 Plus」が週間 1.66 兆トークンの呼び出し量で世界首位に立っていたが、わずか 1 週間後(4 月 13 日~19 日)にはランキング圏外に転落した。

さらに記者が確認したところ、これまでに複数回ランキング入りしていた「Kimi K2.5」や智譜 AI の「GLM」シリーズモデルは、3 週連続でランキング入りを逃している。かつて一時 2 位に浮上した「階躍星辰(StepFun)」の「Step 3.5 Flash」も、ここ 2 週間はランキングから姿を消している。

胡氏は、OpenRouter プラットフォームのユーザーは開発者や中小企業が中心であり、モデルの反復能力や垂直分野における製品力に極めて高い要求を突きつけられていると分析する。「市場のユーザーはヘッドクラスの主力モデルに集中する傾向にあり、手が届く範囲内であれば、ユーザーは最も優れたものだけを使う」と同氏。ユーザーのシナリオは、強力なツール呼び出し能力、マルチエージェント(Agent)のサポート、長期的かつ複雑なタスクの継続的な達成能力をモデルに求めるようになってきており、「現在、OpenRouter 上の大多数のモデルは、この点での強化が急務だ」と指摘した。

また業界関係者も『毎日経済新聞』の取材に対し、演算コストの上昇を受け、業界全体でパフォーマンスが安定し、出力結果が信頼できるツールが優先的に選択されるようになり、価格はもはや最優先事項ではなくなったと指摘している。

AI 開発現場でのコスト意識の高まりを示すイメージ

専門家「世界の消費量はまだ急成長の軌道にある」

短期的なデータの波動は、AI アプリケーションブームの終焉を意味するのだろうか。

「短期間で結論を出すのは時期尚早だ」。胡氏は注意を促す。OpenRouter におけるトークン呼び出し量は世界の総消費量の約 2~4%にすぎず、そのランキングの変動は、あくまでオープンソースや 2 番手以降、新規参入モデル間の競争状況を反映するものであり、市場全体を代表するものではないという。

実際には、コスト圧力が市場の進化を促している。胡氏の観察によると、今年初め以来、「OpenClaw」など各種のエージェントやマルチエージェント・アプリケーションの登場により、トークン呼び出し量は昨年末の 2~3 倍の水準にまで引き上げられたという。コストの大幅な上昇は、企業やユーザーに、メモリの最適化、プロンプトの圧縮、ハーネス・エンジニアリング(制約工学)などの手段を用いて、自発的な消費削減を促している。

記者が取材したところによると、中小の起業家の中には、トークンの使用量を従業員の業績評価に組み入れるところまで出てきている。市場は、単純に量を追求する「量の水増し」段階から、より高い投資対効果(ROI)を追求する「効率化」の段階へと進化を遂げているのだ。

さらに深層での変化は、AI アプリケーション・シナリオそのものの質的転換にある。国聯民生証券(Guolian Minsheng Securities)の調査レポートでは「トークン・インフレ」との概念が提唱されている。これはトークンそのものが高騰していることを指すのではなく、単位時間あたり、あるいはユーザー 1 人あたりのトークン消費量が構造的に上昇している現象を指す。

ユーザーのニーズは、表層的な「質問応答」から、実務的な「作業遂行」へとシフトしている。トークンは、従来のインターネット時代のように限界費用がほぼゼロの「トラフィック(通信量)」ではなく、生産タスクを実行する際に不可欠な「燃料」なのだ。

JP モルガンは調査レポートにおいて、中国市場に対し極めて楽観的な予測を示した。2025 年から 2030 年にかけて、中国におけるトークン消費量の年間平均成長率(CAGR)は 330%に達し、5 年間で 370 倍に増加すると見込んでいる。

胡氏もまた、長期的なトレンドに対して断固として楽観的だ。「中長期的に見れば、OpenRouter 上の統計データがどう変動しようとも、中国を含め、世界のトークン消費総量は急成長の軌道にあり、今後 2~3 年で数十倍、あるいは数百倍に増加するだろう」。

目下の呼び出し量の減少は、価格の衝撃による一時的な乗り換えに過ぎないのかもしれない。真の問いは、AI ブームが去ったかどうかではなく、トークンが「無料試用」から「実勢価格」の時代へと移行する中で、どのモデルが市場からの真摯な投票(真金白銀での代償)に耐えうるかという点にある。

表紙画像出典:毎経メディア資産ライブラリ

記事の区切り線

毎日経済新聞 nbdnews 独占記事

無断転載・抜粋・複製・ミラーリング等を禁じます

転載を希望される場合は、当公式アカウントのバックステージより申請し、承認を得てください

アプリダウンロード用 QR コード
関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.