史丹佛 423 頁 AI 報告出爐!中美差距僅 2.7%,清華 DeepSeek 衝進全球前十

圖片

新智元報導

編輯:好困 桃子

【新智元導讀】史丹佛「2026 年 AI 指數報告」重磅出爐!這份 432 頁長文含金量極高:中美 AI 巔峰對決,差距幾乎抹平,縮減至僅 2.7%。全球頂尖 AI 年產 95 個,基本都聚集在大廠。最殘酷的是,22-25 歲開發者的就業已被切掉 20%。

今天,史丹佛 HAI 重磅發布「2026 年 AI 指數報告」!

這份長達 423 頁的年度報告,全面揭示了全球 AI 產業的最新權力版圖。

圖片

它給出了一條核心結論:AI 的本事漲得飛快;但人類衡量和管好它的能力,卻沒怎麼跟上步伐。

其中,最震撼的結論是——

中美 AI 模型性能差距已基本消失,雙方在巔峰對決中頻繁易主,目前 Anthropic 領先優勢僅剩 2.7%。

美國在 AI 上砸的錢比誰都多,但招攬頂尖人才卻越來越吃力了。

報告還指出,AI 的進化不僅沒有遭遇所謂的「瓶頸」,反而正以史無前例的速度狂飆。

過去一年,全球超過 90% 的頂尖模型,在博士級科學問題、多模態推理、競賽數學上的表現,追平甚至超越了人類。

特別是在代碼能力上,SWE-bench 的成績在一年內,從 60% 飆升至近 100%。

圖片

然而,AI 的「偏科」現象極其嚴重,呈現出一種畸形的現狀:

LLM 可以拿下 IMO 金牌,卻讀不對模擬時鐘,正確率僅為 50.1%。

與此同時,AI 搶飯碗這事兒已經從預測變成了現實,而且最先遭殃的就是當代年輕「打工人」。

下面直接上乾貨,「2026 年 AI 指數報告」最值得關注的 12 個硬核趨勢。

圖片

其他亮點速覽:

  • 全球 AI 算力 3 年漲 30 倍,輝達(NVIDIA)獨占 60%,幾乎所有晶片都出自一家台積電

  • 2025 年全球企業 AI 投資 5817 億美元,同比翻倍,美國一國吃下近一半

  • 進入美國的研究人員 7 年跌 89%,僅過去一年就跌 80%

  • 22-25 歲軟體開發者就業自 2024 年起下滑 20%,入門崗位被精準切掉

  • 中國累計建成 85 台公共 AI 超算,是北美的兩倍以上,全球第一

  • 中國職場 AI 使用率超 80%,遠超全球 58% 的平均

  • 最強模型越來越黑箱,95 個代表性模型裡 80 個沒有公開訓練代碼

圖片

中美貼臉
差距只剩 2.7%

史丹佛把 2023 年 5 月以來 Arena 榜單上的美國第一和中國第一,畫在了同一張座標系裡。

2023 年 5 月,gpt-4-0314 拿 1320 分領跑,中國這邊還是 chatglm-6b,差距 300 多分。

2025 年 2 月,DeepSeek-R1 第一次和美國頭部模型短暫打平。

圖片

2026 年 3 月,美國的 Claude Opus 4.6 拿到 1503 分,中國 dola-seed-2.0-preview 拿到 1464 分。

如今中美 AI 之間的差距,僅有 39 分。換算成百分比,2.7%。

更值得說的是過去一年的換位頻率。從 2025 年初開始,兩國頭部模型已經在 Arena 上你來我往換了好幾次位置。

圖片

數量上同樣接近五五開。

2025 年美國發布了 50 個「顯著模型」,中國緊跟著也發布了 30 個頂尖大模型。

第一梯隊裡 OpenAI、Google、阿里、Anthropic、xAI 同台站位,全球 TOP 5 五五分賬。

再往下看到 TOP 10,中國機構和企業占了四席,阿里、DeepSeek、清華、字節。

圖片

圖片

開源生態這一年的重心也明顯東移。

DeepSeek、Qwen、GLM、MiniMax、Kimi 一路把開源權重的能力曲線往前推。

再算上論文發表量、被引數、專利產出量、工業機器人裝機量,中國統統全球第一。

圖片

價格層面是另一條戰線。

海外開發者在 X 上算過一筆帳,Seed 2.0 Pro 的輸出價格大約只有 Claude Opus 4.6 的十分之一。

性能貼臉,價格只要十分之一。這件事的連鎖反應才剛剛開始。

圖片

90% 前沿模型出自產業
封神速度史無前例

去年發布的 95 個最具代表性的模型裡,超過九成都來自產業界,不是學術機構,也不是政府實驗室。

學術界已經追不上前線了。

圖片

發布速度也在變態加速。

光是 2026 年 2 月一個月,就有 Gemini 3.1 Pro、Claude Opus 4.6、GPT-5.3 Codex、Grok 4.20、Qwen 3.5、Seed 2.0 Pro、MiniMax M2.5、GLM-5 八九個旗艦模型同月入場。

封神週期從「年」變成了「月」。

圖片

圖片

基準一年封頂
AI 沒有瓶頸

最猛的曲線是編程。

SWE-bench Verified 這個真實修 Bug 的基準,一年時間從 60% 漲到接近 100%。

不是涨了幾個點,是基本封頂。

圖片

Terminal-Bench 測試 Agent 處理真實終端任務的能力,從去年的 20% 漲到 77.3%。

網路安全 Agent 解決問題的成功率,從 15% 漲到 93%。

Gemini Deep Think 在國際數學奧林匹克拿到金牌。

PhD 級科學問答(GPQA Diamond)、競賽數學(AIME)、多模態推理(MMMU)這些原本被認為「人類不可超越」的硬骨頭,全部被前線模型啃了下來。

圖片

圖片

圖片

最能說明問題的是 Humanity's Last Exam。

這是一個專門被設計來「難倒 AI、偏袒人類專家」的測試,題目由各個領域的頂尖專家提供。

去年 OpenAI 的 o1 拿到 8.8%,前線模型在一年時間裡把分數往上又推了 30 個百分點,目前 Claude Opus 4.6 和 Gemini 3.1 Pro 已經雙雙過了 50%。

圖片

圖片

鋸齒前線
能拿 IMO 金牌卻看不懂表

但同一份指數甩出了另一組數字。

最強模型在「讀模擬時鐘」這個任務上的正確率,是 50.1%。

圖片

圖片

機器人在實驗室仿真環境(RLBench)裡的操作成功率已經達到 89.4%。但搬到真實家庭場景裡完成洗碗、疊衣服這類家務,成功率立刻掉到 12%。

實驗室和廚房之間,差了 77 個百分點。

研究者把這種現象命名為「鋸齒前線」(jagged frontier)。AI 能力的分佈是凹凸不平的,能拿數學奧賽金牌,卻沒法穩定地告訴你現在幾點。

AI 能在數學奧賽拿金牌,但只有一半的機率能看懂模擬時鐘。AI 在加速,但加速的不是同一個方向。

圖片

圖片

另外,在智能體任務中,OSWorld 測試中,前線 AI 實力(66.3%)正逼近人類基線。

圖片

然而,在專門評估科研邏輯的 PaperArena 測試中,最強 AI 加持的 Agent,得分僅 39%,只有博士生一半的功力。

圖片

但這種凹凸已經不影響企業把 AI 往生產線上塞。

AI Index 給出的另一個數字是,全球企業 AI 採用率達到 88%。九成的公司已經把 AI 接進了某個工作流程。

代價同步在漲。AI 相關事故記錄從 2024 年的 233 起漲到 362 起。

圖片

圖片

錢在加速
5817 億砸進 AI

2025 年全球企業 AI 投資達到 5817 億美元,同比增長 130%。其中私募投資 3447 億美元,同比增長 127.5%。

兩條曲線都幾乎翻倍。

國別上,美國一騎絕塵。2025 年美國私募 AI 投資 2859 億美元。並且一年新增 1953 家 AI 創業公司,也是排名第二的 10 倍以上。

圖片

錢在加速湧向美國。但美國的另一項核心資源,正在反向流動。

圖片

人在流走
進美國的研究人員跌了 89%

裡面有一組數字讓人愣了一下。

2017 年到現在,進入美國的研究人員和開發者數量下降了 89%。

更關鍵的是,這個下降在加速。僅僅過去一年,下降幅度就達到 80%。

圖片

美國仍然是全球研究人員密度最高的國家,但流入的水龍頭正在擰緊。

錢和人這兩條曲線開始反向。這是過去十年沒出現過的局面。

圖片

算力三年漲 30 倍
命門都在一家公司手裡

AI 能力曲線在加速,背後那條算力曲線跑得更猛。

從 2021 年到現在,全球 AI 算力總量漲了 30 倍。過去三年裡,每年都在翻三倍以上。

圖片

撐起這條曲線的是少數幾家公司。

輝達(NVIDIA)一家的 GPU,占據了全世界 AI 算力的 60% 以上。亞馬遜和 Google 靠自研晶片排在二三位,但加起來也遠遠追不上輝達。

而几乎所有這些晶片,都來自一家代工廠,台積電。算力曲線越陡,命門就越窄。

與此同時,代價也在加大。

全球 AI 數據中心的總功率已經達到 29.6 GW,相當於紐約州在用電高峰時段的全部用電需求。xAI Grok 4 一次訓練的估算碳排放是 72816 噸二氧化碳當量,相當於 17000 輛汽車開一整年的尾氣。

數據中心建在哪裡,電從哪裡來,晶片從哪裡產,這三個問題已經變成今年所有 AI 公司 CEO 案頭最頭疼的事。

圖片

生成式 AI 三年滲透 53%
中國職場使用率破 80%

生成式 AI 在三年內達到了 53% 的全球人口滲透率。

這個速度比個人電腦快,比網際網路快。

但滲透速度和國別相關性極強。新加坡 61%,阿聯 54%,都跑在美國前面。美國在調查覆蓋國家中只排第 24 位,滲透率 28.3%。

如果把維度從消費者換成職場,反差更大。

報告裡另一組數據顯示,2025 年全球 58% 的員工在工作中已經開始經常性使用 AI。但在中國、印度、奈及利亞、阿聯、沙烏地阿拉伯這 5 個國家,這個比例超過了 80%。

中國的職場 AI 滲透率,已經比全球平均高出 20 個百分點以上。

圖片

更有意思的是消費者價值。

AI Index 估算,到 2026 年初,生成式 AI 工具每年給美國消費者創造 1720 億美元的價值。從 2025 年到 2026 年,每個用戶的中位數價值翻了三倍。

絕大多數用戶用的還是免費版。

普通人願意為 AI 付的錢,遠低於 AI 給他們創造的價值。這中間的剪刀差是現在所有 AI 公司都在試圖彌合的東西。

圖片

入門崗位銳減
22-25 歲開發崗狂砍 20%

整份 AI Index 裡最讓中文讀者沉默的,可能是關於年輕就業的部分。

22 到 25 歲的軟體開發者群體,從 2024 年至今,就業人數下降了大約 20%。

同期,年紀更大的同行群體反而在增長。

不止開發崗。客服等其他高 AI 暴露行業,也在出現同樣的模式。

更讓人擔心的是企業問卷的結果。受訪高管普遍預期,未來的裁員幅度會比過去幾個月還要大。

這不是宏觀失業率的事,是入口崗位被精準切掉的事。

第一份工作沒了,整個職業階梯就斷了一格。這件事的長期影響,現在沒人能算清。

圖片

圖片

AI 正在改寫科學發現的方式

如果說就業那一段是冷的,科學這段就是熱的。

自然科學、物理科學、生命科學領域的 AI 相關論文,2025 年同比增長了 26% 到 28%。

具體到應用,今年第一次有 AI 完整跑通了端到端的天氣預報流程。從原始氣象觀測數據直接吐出溫度、風速、濕度的最終預報,中間沒有任何傳統數值模型介入。

AI 從「幫你寫論文」「幫你算數字」,正在變成「自己做發現」。

圖片

醫院裡也是一樣。2025 年大量醫院開始部署能從就診對話自動生成臨床記錄的 AI 工具。多個醫院系統的醫生反饋,寫病歷的時間減少了多達 83%,工作倦怠顯著下降。

但同一份指數給醫療 AI 潑了一盆冷水。一份針對 500 多個臨床 AI 研究的綜述發現,將近一半的研究依賴考試題式的數據集,只有 5% 用了真實臨床數據。

AI 能減少醫生敲鍵盤的時間,這件事是確定的。AI 在真實病人身上的臨床價值,目前還有大量問號。

圖片

圖片

自學浪潮全球開炸
正規教育已經掉隊

正規教育跟不上 AI 了。

美國有 4/5 的高中生和大學生現在用 AI 完成學校作業。但只有一半的中學有 AI 使用政策,只有 6% 的老師認為這些政策寫得清楚。

學生跑在前面,老師還在原地,規則還沒出現。

圖片

正規教育跟不上的同時,自學浪潮在全球開炸。裡面寫,學 AI 工程技能增長最快的三個國家分別是阿聯、智利和南非。

不是美國,不是歐洲。

技能曲線的最陡峭的那一段,長在所有人都沒在看的地方。

圖片

圖片

最強模型變成最不透明的
專家和公眾撕裂

最強的模型,正在變成最不透明的模型。

Foundation Model Transparency Index 今年的平均分從去年的 58 分跌到了 40 分。AI Index 直接點名,Google、Anthropic、OpenAI 都已經放棄公開最新模型的訓練數據規模和訓練時長。

去年發布的 95 個最具代表性的模型裡,80 個沒有公開訓練代碼。

公眾的情緒也變得更複雜。

圖片

全球範圍內,認為 AI 利大於弊的比例從 52% 上升到 59%。但同期,對 AI 感到緊張的比例從 50% 上升到 52%。

兩個方向在同時增長。

最分裂的是美國。只有 33% 的美國人認為 AI 會讓自己的工作變得更好,全球平均是 40%。美國人對本國政府監管 AI 的信任度,是受訪國家裡最低的,31%。

新加坡人對自己政府監管 AI 的信任度,是 81%。

圖片

最近 Sam Altman 家被襲擊的事件之後,矽谷圈內人「驚訝地發現」Instagram 評論區裡的普通人對此並不同情,甚至有人覺得「應該更激烈一點」。

他們沒意識到事情已經糟到這個程度。

研報引用的 Pew 和 Ipsos 數據,專家和公眾在 AI 影響就業、醫療、經濟這些維度上的觀感差距,普遍超過 30 個百分點,最大的一項達到 50 個百分點。

一邊是實驗室裡的曲線在飛漲,一邊是普通人心裡的不安在累積。

中間沒有橋。

圖片

寫在最後

423 頁的報告裡有幾百張圖表,但其實只畫了一張圖。

橫軸是時間,縱軸是能力。

模型能力的曲線在飛,算力曲線在飛,投資曲線在飛,採用率曲線在飛。其他全都在原地踏步或者向下。

這就是 2026 年 AI Index 的全部內容。

AI 在加速。其他所有東西都在脫節。

如果你是這個行業裡的人,現在該問的問題不是「未來會怎樣」,而是「自己站在哪一條曲線上」。

參考資料:

https://hai.stanford.edu/ai-index/2026-ai-index-report

https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report

https://www.nature.com/articles/d41586-026-01199-z

https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf

秒追 ASI

⭐ 點讚、轉發、在看一鍵三連 ⭐

點亮星標,鎖定新智元極速推送!

圖片

圖片

相關文章推薦

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.