中国が初めて米国を追い抜き、Hugging Faceプラットフォームにおける月間ダウンロード数最大のモデル提供国となった。
しかも、この劇的な変化はわずか1年の間に起こった。
Hugging Faceのこのレポートは、オープンソースAIエコシステムの真の姿を明らかにする。世界の競争環境の再構築、地域勢力の台頭から、ロボット工学や科学分野における新たな戦場まで、完全かつ鮮明なオープンソースAIの地図を提示する。
中国の頂点への到達とエコシステムの変容
2025年はオープンソースAIにとって分水嶺となる年だった。
Hugging Faceプラットフォームのユーザー数は1,300万人に達し、公開モデル数は200万個を突破、データセットは50万個を超えた。これらの数値は前年と比較してほぼ倍増している。
この成長の背後には、より深い変化が隠れている。ユーザーはもはや単なるモデルの消費者ではなく、派生作品の作成、モデルのファインチューニング、アダプター、ベンチマーク、アプリケーションが次々と登場し、ますます多くの人々が参加している。
エコシステムの繁栄は、集中度の問題を覆い隠すものではない。
モデルの約半数はダウンロード数が200回に満たない一方、上位200位のモデルは総数のわずか0.01%でありながら、ダウンロード数の49.6%を占めている。
オープンソースAIは、複数の重なり合うサブエコシステムから構成されている。各サブエコシステムは特定の分野、言語、または問題領域を中心に独自のコミュニティを形成しており、全体のダウンロード数が少なくても、持続的な参加と再利用を維持している。
競争環境は深刻な調整を経ている。
フォーチュン500企業の30%以上が、すでにHugging Faceに認証アカウントを開設している。
スタートアップ企業はオープンソースモデルをデフォルトのコンポーネントとして扱っている。Thinking MachinesのTinkerモデルは完全にオープンソースの重みに基づいて構築されており、VSCodeやCursorなどの主要なIDEはオープンソースとクローズドソースのモデルを同時にサポートしている。
Airbnbなどの伝統的な米国企業もオープンソースエコシステムへの投資を拡大しており、Hugging Faceは2025年を通じて、より多くの伝統的な企業が組織のサブスクリプションをアップグレードするのを目撃している。
大手テクノロジー企業の動きはさらに注目に値する。
NVIDIAは最も活発な貢献者となり、各社はこぞってHugging Face Hub上で新たなリポジトリを作成している。リポジトリの増加曲線は、継続的な投資を明確に示している。
オープンソースソフトウェア分野における研究によれば、オープンソース成果物の下流価値はその生産コストをはるかに上回る。同様の法則がAI分野でも顕在化しつつある。
オープンソースモデルは数千の下流アプリケーションで再利用、適応、特化されている。クローズドソースシステムのみに依存する組織は、往々にしてより高いコストに直面し、展開やカスタマイズにおける柔軟性も制限される。
地政学的構図の変化が最も劇的である。
過去4年間の累積ダウンロード数のデータによると、米国と中国が一貫して主要な貢献者であり、英国、ドイツ、フランスがそれに続いている。
モデル開発者が個人ユーザーや分散型組織であり、明確な地理的帰属がない場合、プラットフォームの総ダウンロード数の約半分を占める。
しかし、2025年には根本的な転換が起こった。
Hugging Faceのデータによると、中国は月間ダウンロード数と総ダウンロード数の両方で米国を超え、トップに立った。過去1年間で、中国のモデルは急速にダウンロードシェアの41%を占めるに至った。
業界全体における開発のシェアは、2022年以前の約70%から2025年には37%に低下した。
同期間において、独立または無所属の開発者は17%から39%に上昇し、時には総使用量の半分以上を占めることもあった。
個人や小規模なグループは、基盤モデルの量子化と適応に焦点を当てている。これらの中間層は現在、ユーザーが何を実行できるか、そして革新がいかにエコシステム内で伝播するかを左右する重要な役割を担っている。
地域ごとにエコシステムへの参加方法は異なる。
米国と西欧は歴史的に、Google、Meta、OpenAI、Stability AIといった大規模な産業ラボを通じて主導してきた。一方、中国は公開と採用の両面でますますリーダーシップを発揮している。
フランス、ドイツ、英国は、研究機関、国家AI計画、特化型モデルファミリーを通じて貢献を続けている。多様な貢献者と組織形態をサポートするエコシステムは、より広く採用される成果を生み出す傾向にある。
スタートアップ企業の人気モデルはより広く普及している。競争力を持つ国には、フランスと韓国が含まれる。
特筆すべきは、新たな人気モデルを開発する第4位の主体が、組織ではなく個人ユーザーであることだ。ユーザーレベルで競争力のあるモデルを作成することは、かつてないほど容易になっている。
DeepSeek R1モデルが2025年1月に viral な広がりを見せたことは、中国オープンソース隆盛の象徴的な出来事となった。
これ以降、競争力のある中国組織の数と、Hugging Face上のリポジトリ数は爆発的に増加した。
Baidu(百度)は、2024年のHub上での公開ゼロから、2025年には100以上のリポジトリへと急増させた。
ByteDance(字節跳動)とTencent(騰訊)の公開数は8〜9倍に増加した。
以前はクローズドソース戦略を志向していたBaiduやMiniMaxなどの組織も、オープンソース公開へと断固たる転換を果たした。
米国側では、同数の有力組織が、より多くのリポジトリを持続的に提供している。Metaとその前身であるFacebook研究組織は、オープンソース公開のかなりの割合を占めている。Googleも一定程度の貢献をしているが、その度合いは低い。
両者を並べると、中国の有力組織におけるリポジトリ増加の急激な上昇軌跡は、重要な戦略的差異を示している。
主権AIとハードウェアの版図
オープンソースAIはますます「主権」の問題と密接に結びついている。
オープンウェイトモデルは、政府や公共機関が国内の法的枠組みの下で、ローカルデータを用いてシステムをファインチューニングすることを可能にする。
自国内のハードウェアで展開可能なモデルは、海外が支配するクラウドインフラへの依存を減らす。モデルアーキテクチャ、トレーニングプロセス、評価の透明性は、規制による審査と公的説明責任を支える。
各国政府はすでに行動を開始している。
韓国の国家主権AI計画は2025年半ばに開始され、LG AI Research、SK Telecom、Naver Cloud、NC AI、Upstageを国家チャンピオン企業に指名し、競争力のある国内モデルを開発させている。
2026年2月、3つの韓国モデルが同時にHugging Faceのトレンド入りした。
2026年3月、韓国は米国のスタートアップ企業Reflection AIとデータセンター協力を発表し、最先端のオープンウェイトモデルを韓国に導入した。
スイスのAI計画や複数のEU資金プロジェクトも同様の優先順位を反映している。英国の「公的資金、公的コード」という原則は、複数の政府支援AIイニシアチブに影響を与えている。
投資は成果を上げつつある。モデルとデータセットは通常、開発地域で最も多く利用される。開発者は多くの場合、その言語を最もよく反映し、類似の技術的・応用的ニーズを示すモデルを選択する。
最も人気のあるモデルのランキングも変化している。
1年前、最も愛されていたモデルは主に米国のMeta Llamaファミリーだった。
1年後、ランキングは国際的な混合様相を呈し、中国のDeepSeek-R1がトップに立った。この指標は必ずしも使用量を反映するものではないが、蓄積された注目度は関心のシグナルを示している。
論文と科学的貢献の面では、Hugging Face Daily Papersのデータによると、大手AI組織の論文がコミュニティメンバーから広く認められている。
最も高く評価されている論文は、主に米国と中国のトップ組織からのものである。
中国の大型テクノロジー企業が多くを占め、ByteDanceは多くの高影響力論文を共有している。
別の角度から見ると、モデルとデータセットの作成に関わる論文は、より多様なオープンソース採用を示している。医学関連論文の影響力が際立っており、大型テクノロジー企業の影響は逆に分散している。
派生モデルのデータは、興味深い現象を明らかにしている。
Alibabaは組織として、その派生モデル数がGoogleとMetaを合わせた数を上回っている。Qwenファミリーは113,000以上の派生モデルを構成する。Qwenとタグ付けされたすべてのモデルを計算に入れると、その数は200,000を超える。
モデル開発において、アクセシビリティがますます重視されている。
小規模モデルのダウンロードと展開率は、超大規模システムよりもはるかに高く、コスト、レイテンシ、ハードウェアの利用可能性という現実的な制約を反映している。
小規模モデルの優位性は、公開数が多いことにも一部起因するが、正規化しても、ATOMプロジェクトの相対的採用指標によれば、パラメータ数1億〜90億の中央値トップ10モデルのダウンロード数は、パラメータ数1,000億以上のモデルよりも約4倍高い。
自動化システムとCIパイプラインが小規模モデルのダウンロード数をさらに押し上げているが、小型の展開可能なモデルへの移行傾向は確実にある。
オープンソースモデルへのユーザーの参加は、通常、公開直後にピークに達し、その後減速する。平均参加期間は約6週間である。関連性を維持するには、継続的な改善と頻繁な更新が不可欠である。
DeepSeekの連続リリース(V3、R1、V3.2)は、新たな挑戦者が現れても競争力を維持させた。開発が停滞した組織は急速にシェアを失い、頻繁に更新したり、特定分野でファインチューニングを行う競合に敗北している。
ダウンロードされるモデルのサイズも変化している。2023年のダウンロードモデルの平均パラメータ数は8億2700万だったが、2025年には208億に上昇した。これは主に量子化とMixture of Experts(MoE)アーキテクチャによって推進されている。
一方、中央値は3億2600万から4億600万への小幅増加にとどまっている。この格差は、ハイエンドの大規模言語モデルユーザーが平均値を押し上げている一方で、ローエンドの小規模モデルの利用は安定していることを示している。
最先端モデルと小型システムの性能差は、ファインチューニングとタスク適応によって急速に縮小することが多い。
Hugging Face Hubでは、数億パラメータのモデルが検索、注釈付け、文書処理のワークフローをサポートし、数億パラメータのモデルがコーディング、推論、マルチモーダルタスクに広く利用されている。
主要なモデル開発者の多くは現在、異なるサイズをカバーするモデルファミリーを公開している。能力のある小型モデルは自律性をエッジ(端末)に押し出し、集中型クラウドプロバイダーへの依存を減らしている。
オープンソースAI開発はハードウェアのトレンドと密接に結びついている。
ほとんどのモデルはNVIDIA GPU向けに最適化されているが、AMDハードウェアのサポートは継続的に拡大している。
Stability AIのモデルセットは現在、NVIDIAとAMDの両プラットフォーム向けに最適化されている。ライブラリは両者に対応するものが増え、ツールの改善によりクロスハードウェア展開がより直接的になっている。
2025年、Hugging FaceはKernel Hubを立ち上げ、NVIDIAおよびAMD GPU向けに最適化されたカーネルの読み込みと実行を可能にした。
中国のオープンソースモデルは、国産チップの明確なサポートを開始している。
Alibabaは推論特化型チップアーキテクチャに投資しており、中国のデータセンターがローカルでオープンソースモデルを実行できるハードウェアを備えることを目指している。
オープンウェイトモデルにとって、計算資源は依然として開発と展開の中核的な要件だが、それらは、特定のエコシステムがすべてであり終わりであるという状況を打破する助けとなっている。あらゆる性能レベルでモデルが提供されており、最大手開発者の旗艦AIモデルと比較して、コストは10分の1から1000分の1の効率で済む。
オープンソースインフラへの投資問題は依然として喫緊の課題である。オープンソースモデルのトレーニングと提供が可能な公的資金によるデータセンターは、特に欧州や英国において、ますます重要な政策議論のテーマとなっている。
大手クローズドソースモデル企業が利用可能な計算資源と、オープンソースコミュニティが入手可能な資源との格差は、オープンソース開発の実現可能性の境界線を形成し続けている。
ロボット工学と科学の新境地
ロボット工学はHugging Faceにおいて最も急成長しているサブコミュニティの一つとなった。
その数値は注目に値する。ロボットデータセットは2024年の1,145個から2025年には26,991個へと増加し、3年間で第44位からデータセットカテゴリーの第1位へと急上昇した。
比較として、第2位のカテゴリーであるテキスト生成は2025年でも約5,000のデータセットにとどまっている。
コミュニティが貢献したデータセットは、家庭内の操作タスクから自動運転まで幅広くカバーしている。最大の空間知能マルチモーダルデータセットであるLearning to Driveは、LeRobotとYaakの協力で公開された。
RoboMINDなどのデータセットは107,000以上の実世界の軌跡を提供し、479の異なるタスクと多様なロボット形態をカバーしている。これは、汎化可能なロボットポリシーのトレーニングに必要な規模と多様性を提供している。
Hugging FaceによるPollen Roboticsの買収により、オープンソースロボットの販売は産業ラボ、学術ラボ、そして一般的な愛好家へと拡大している。
LeRobotはHugging Faceのオープンソースロボットライブラリであり、実世界ロボットのモデル、データセット、PyTorchツールを提供する。模倣学習、強化学習、視覚言語アクションモデルをカバーし、過去1年間でGitHubリポジトリのスター数はほぼ3倍になった。
科学研究はもう一つの活発な分野である。オープンソースモデルとデータセットは、タンパク質折りたたみ、分子動力学、創薬、科学データ分析においてますます多く利用されている。すべての最先端AI企業は現在、専任の科学チームを持っているが、現時点での焦点は直接的な実験ではなく文献発見にある。
コミュニティ主導のプロジェクトは共通の研究目標の周りに形成され、しばしば機関や学科を超えた数百人の貢献者が関わる。これらの取り組みは、伝統的な学術や企業組織だけでは組織化が困難な、大規模な学際的な作業の調整メカニズムとしてのオープンソースの役割を際立たせている。
今後を展望すると、オープンソースAIエコシステムは世界規模の参加、技術的特殊化、制度的採用を通じて進化し続けている。いくつかの傾向が次の段階を定義するだろう。
地理的勢力の再均衡は加速している。西洋の組織は、中国モデルの商業的に利用可能な代替品をますます求めている。OpenAIのGPT-OSS、AI2のOLMo、GoogleのGemmaなどの取り組みは、米国や欧州の開発者による競争力のあるオープンソース選択肢を提供することをより緊急の課題としている。これらの取り組みがQwenやDeepSeekの採用勢力に匹敵できるかどうかが、2026年の決定的な問題となるだろう。
ロボット工学と科学サブコミュニティの成長は、オープンソースAIが言語や画像生成から物理および実験分野へと拡大していることを示している。テキストおよび画像モデル開発を取り巻くインフラ、規範、調整メカニズムは、新しいモダリティやユースケースに適応しつつある。
研究者、開発者、企業、政府にとって、オープンソースはAIシステムの構築、評価、ガバナンスにおける基盤層であり続けている。
エージェントの展開が増加するにつれ、オープンソースとその相互運用性は、エージェントが健全に発展するための鍵となる。
過去1年の軌跡は、オープンソースエコシステムがAIの開発、適応、展開の実務が大規模に行われる場であることを明確に示しており、より広範なAI情勢への影響力は増大し続けている。
参考資料:
https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026