奧特曼宣判 Transformer 死刑!AGI 兩年內降臨,下一代架構已在路上

圖片

新智元報導

編輯:好困 桃子

【新智元導讀】終結 Transformer 的架構即將誕生!奧特曼最新訪談豪言,下一代 AI 架構徹底顛覆 Transformer,LSTM 的命運或許再次上演。

Transformer 的最大受益者,親手給它判了死刑!

這幾天,Sam Altman 回到史丹佛,面對一群大二學弟學妹,扔出了一顆深水炸彈——

未來一定會誕生全新的底層架構,性能躍升不亞於當年 Transformer 對 LSTM 的降維打擊。

要知道,GPT 帝國就建在 Transformer 上面。

ChatGPT、GPT-4、o1、Codex,全是這套架構的果實。

而現在,摘果子的人親口說:這棵樹的壽命快到頭了。

甚至,奧特曼直言不諱,我們所追求的 AGI 可能只是一次「熱身」(warm up)而已!

而下一代全新架構突破已在路上——現有的高階 LLM 已具備足夠的認知力,能夠作為人類智力槓桿,親手推開另一個技術範式的大門。

圖片圖片

用 AI 找到下一個 Transformer

人們都說,暴力出奇蹟,但暴力本身也有極限。

Transformer 有一個天生的算力黑洞:文字長度翻 10 倍,計算量翻 100 倍。

這就是為什麼今天跑 GPT-5.4 等級的模型,燒錢速度是天文數字。

奧特曼顯然看到了這面牆。但他並不覺得沒路走了,恰恰相反,他覺得推翻這堵牆的工具已經到手了。

訪談中有一句極其關鍵的話:現在的模型終於聰明到可以輔助人類去做這種等級的科研了。

圖片

意思是,找到下一代架構這件事本身,已經可以讓 AI 來幫忙了。

用當下的 AI 去發現能取代它的新架構,邏輯鏈條很清楚:

模型越強→科研效率越高→新架構被發現的機率越大→新架構反過來讓模型更強。

一個自我加速的飛輪,就這樣形成了。

奧特曼之所以有底氣下這個判斷,跟一路走來對範式轉換的獨特嗅覺有關。

大一暑假,他跑去史丹佛的 AI 實驗室打工,結論是「這些玩意兒根本沒戲」,然後就跑去搞别的創業了。

不過,對 AI 的關注卻從未間斷過。用奧特曼自己的話說,這是一種「抬頭看全局」的習慣,別陷入管中窺豹。

2012 年 AlexNet 橫空出世,他和大多數人一樣,覺得「挺酷的」,但沒往心裡去。

圖片

接下來幾年,深度學習模型越做越大、越做越強,奧特曼一直在旁邊看著。直到某個臨界點,感覺徹底變了——這東西簡直像一顆正在逼近的小行星,極其瘋狂,但整個世界居然沒幾個人當回事。

於是 2015 年 OpenAI 成立。核心信念只有一條:把深度學習的規模往死裡推,看看會發生什麼。

但當時說要建 AGI 實驗室,整個行業的老前輩都覺得他們瘋了,甚至直接說他們是騙子。

不過結果大家都看到了。

GPT-2 讓奧特曼第一次見到電腦做出了前所未有的事情,GPT-3 驚艷了世界,GPT-4 更上一層樓。當你站在一個正確的範式上死磕,回報是指數級的。

現在,同樣的直覺被投射到了下一個範式上。

Transformer 不是終點,就像 LSTM 不是終點。

奧特曼甚至給了具體建議:

如果現在是一個研究者,會死磕這個方向,去找「哪裡能挖出核彈級突破」,而且會重度依賴大模型來做科研助手。

圖片

Greg 公寓裡的白板

一個改變世界的夜晚

這場訪談最好看的部分,是奧特曼對 OpenAI 草創期的回憶。

OpenAI 第一天上班,大家聚在聯合創始人 Greg Brockman 的公寓裡。

早上 9 點半、10 點,八九個人陸陸續續到了,坐在沙發上,面面相覷。

然後有人開口:「好吧,咱們乾點啥?」

有人提議寫幾篇論文。又有人說得先弄塊白板。然後就有人直接在亞馬遜上下單,加急配送。

奧特曼說當時內心一陣恐慌:這不行啊。這既不像正兒八經的創業公司,也不像任何能成事兒的組織。

但他緊接著說了一句非常奧特曼的話:在那種時刻,你只要深呼吸,相信如果身邊聚的都是最優秀的人,事情總會迎刃而解。

他賭對了。

圖片

就在那第一週,後來成為 OpenAI 前四年核心理念的大部分點子,都被寫在了那塊白板上。儘管當時他們自己都覺得這些想法不靠譜。

他們一開始壓根沒想過做產品。

奧特曼反覆強調,他們以為自己就是個純研究實驗室,發發論文就好了。

但後來兩件事變得越來越清晰:

  • 第一,這條路蘊含的經濟價值遠超想像;
  • 第二,需要的資金不是幾十億,而是數以千億計。

而真正讓奧特曼建立起信仰的轉折點,是 GPT-2。

他說不記得 GPT-2 發布那天的具體日期了,但他永遠記得第一次跟那個模型對話的那個夜晚。

它做出了我以前從未見過電腦能做出的事情。

那一刻他覺得,妥了,這就是了。

至於 GPT-2 為什麼暫緩發布?奧特曼承認,事後看來有些過度謹慎,但他覺得面對 AI 每一個新的能力台階,稍微偏向謹慎一點沒壞處。

當然也不能慫過頭。如果企業不以足夠快的速度擁抱 AI,就會被完全自治的 AI 公司幹掉,那才是真正的災難。

圖片

史丹佛訪談全景

奧特曼的 10 個判斷

架構預言和創業往事之外,奧特曼在這場訪談中還密集輸出了大量觀點,幾乎每一條都值得單獨拎出來聊。

1. AGI 兩年內降臨。

奧特曼直接告訴台下的大二學生:

等你們畢業的時候,你們將踏入一個已經有 AGI 的世界。

當然,人類的底層驅動力不會變,你還是得搬家、找工作、考慮成家立業。

但科學研究將被高度自動化,創辦初創公司和去大廠打工的意義都將被徹底改寫。

2. 編程智能體是下一個 ChatGPT 時刻。

下一個引爆點是什麼?奧特曼沒猶豫:編程 AI 智能體。

緊隨其後、但尚未完全引爆的,是 AI 在所有知識型工作中執行任務的同等能力。

不過,距離這一天已經不遠了。

3. 一個人能幹出一家中型公司的活兒。

未來會湧現大量一個人或六個合夥人的微型初創公司,影響力和營收甚至能跟今天的中大型企業掰手腕。

奧特曼說 iPhone 問世算是上一次這種級別的機會,這一次更猛。

不僅能做以前不敢想的事,還能用極少的人力極快地把產品和公司建起來。

4. AI CEO?不是不可能。

聊到 AI 對社會的影響,奧特曼說了句耐人尋味的話:

他絕不會自欺欺人地認為,不太遙遠的未來不會出現一個比他更適合執掌 OpenAI 的 AI CEO。

如果有的公司或國家擁抱了 AI 而別人沒有,競爭力差距將是碾壓級的。

這背後的�政治、經濟、社會衝擊,他坦言自己也還沒完全想明白。

5. 但別慌,人類的適應力被嚴重低估了。

奧特曼不是 AI 末日論者。

他反覆強調一個觀點:AGI 聽起來像是要徹底顛覆社會,但身處其中的感覺不會像聽上去那麼驚悚,頂多頭幾天覺得有點懵。

人類渴望對彼此有價值、渴望競爭、渴望創造、渴望表達,這些底層驅動力和不會消失。

也許 100 年後的職業跟今天毫無相似之處,但人永遠有事可做,也永遠在意人與人之間的連接。

圖片

6. 別怕跟 OpenAI 競爭。

有人問,OpenAI 變成終極巨頭怎麼辦?

奧特曼的回答出乎意料地坦誠:當年所有人都說不可能跟谷歌打,結果我們打出來了。

總有一天會有比 OpenAI 更大更成功的公司誕生,而他們絕對不會走一模一樣的路。

他甚至說,谷歌當初如果不那麼「拉胯」,OpenAI 根本不可能出頭。

大廠有大廠的通病。

7. 燒錢快,但不慌。

面對「OpenAI 燒錢速度恐怖」的尖銳提問,奧特曼很淡定:燒錢確實快,但如果今年砸 10 億是為了明年賺 30 億,世界上大把資本排隊想做這筆買賣。

8. 自研晶片是認真的,蓋數據中心免談。

OpenAI 有龐大的定製晶片計畫,對自家推理晶片極其興奮。

至於自建數據中心,用奧特曼原話說就是:真的一萬個不想幹這苦力活。

被逼到那一步也會上,但最好是把伺服器機架設計到極致,髒活累活讓別人幹。

9. 社交產品要被撕開一條口子了。

奧特曼覺得 AI 的機會遠不止給現有軟體「塞個 AI 進去」。

他舉了社交產品的例子:想像一堆 AI 智能體代表各自的用戶在虛擬空間自主聊天、交換資訊,這才是底層邏輯的顛覆。

10. 知道很容易,做到更難了。

這是奧特曼部落格第一篇文章裡就寫過的話。

AI 時代還成立嗎?他說比以前更成立了。

獲取知識越來越容易,做成事情雖然也變容易了,但那是對所有人而言的——你得跟全世界一起捲。

他說他認識的那些把 AI 工具玩得最溜的頂尖高手,都覺得自己的工作從來沒有比現在更難。

工具強到離譜,但用好它們以保持頂尖競爭力也前所未有地艱難。

圖片

Sam,你真的快樂嗎?

訪談最後一個意外瞬間,是學生的靈魂拷問。

要知道,這是一個每天早上 8 點以後人生就徹底失控的 CEO。

先工作幾小時,陪孩子一小時,然後去公司,從那之後就是純粹的兵荒馬亂。

用他的話說,沒有哪家公司像 OpenAI 這樣跑得這麼快、內部這麼混亂、還死死頂在所有人槍口上。

但奧特曼說,他現在是他認識的人裡最快樂的之一。

他分享了一個改變人生的認知轉變。

大多數人覺得糟糕經歷的反面是美好經歷,所以遇到壞事就痛苦。但他把問題重構了,糟糕經歷的反面,其實是徹底失去體驗的能力。

總有一天你連體驗的資格都沒有了,到那時你甚至會懷念那些被虐的日子。

圖片

後 Transformer 賽道

革命已經開始

奧特曼的預言不是空中樓閣。

「後 Transformer」的競賽早就打響了,進展比大多數人想像的快得多。

最高調的挑戰者是 Mamba。

Albert Gu 和 Tri Dao 在 2023 年底提出的這一架構,徹底繞開了「注意力機制」,改用狀態空間模型(SSM)處理序列。

簡單說,Transformer 讀一段話要讓每個詞跟其他所有詞「對視」一遍,Mamba 只維護一個固定大小的記憶狀態,線性時間搞定,推理吞吐量直接快 5 倍。2026 年初 Mamba 已進化到第三代,論文被 ICLR 2026 接收。

產業界的動作更能說明問題。

輝達在 2025 年發布 Nemotron-H 系列,92% 的注意力層被 Mamba 層替換,推理速度提升 3 倍,精度不降反升。

到 2025 年底,輝達全線新模型(Nemotron 3 Nano/Super/Ultra)全部切換到 Mamba-Transformer 混合架構。

AI21 Labs 的 Jamba、IBM 的 Bamba、微軟的 Phi-4-mini-flash-reasoning、LSTM 之父 Sepp Hochreiter 親自操刀的 xLSTM,也紛紛加入混合陣營。

更野的方向也有:Liquid AI 搞出的液態神經網絡(Liquid Neural Networks),靈感來自一條只有 302 個神經元的線蟲。

它用微分方程驅動神經元,推理時還能繼續學習、實時適應環境變化,19 個神經元就能控制自動駕駛。2026 年 1 月發布的 LFM2.5 模型,用遠小於 Transformer 的參數量跑出了驚人的性能。

圖片

下一次大遷徙,會誕生誰?

回顧歷史,從 LSTM 到 Transformer 的每一次架構級遷徙,都釋放了一個數量級以上的能力增長,同時也誕生了定義時代的偉大公司。

上一次遷徙,誕生了 OpenAI。下一次呢?

奧特曼自己都說了:總有一天會有比 OpenAI 更大更成功的公司出現。

也許此刻,那個未來的創始人正坐在某個宿舍裡,對著一塊亞馬遜加急配送的白板,寫下第一個不靠譜的想法。

而他手裡多了一個前所未有的利器——AI 本身。

參考資料:https://x.com/rohanpaul_ai/status/2033117083127644536?s=20
https://www.youtube.com/watch?v=FjlymGBt-vY

秒追 ASI

⭐ 點讚、轉發、在看一鍵三連 ⭐

點亮星標,鎖定新智元極速推送!

圖片圖片

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.