奧特曼宣判 Transformer 死刑！AGI 兩年內降臨，下一代架構已在路上

新智元報導

編輯：好困桃子

【新智元導讀】終結 Transformer 的架構即將誕生！奧特曼最新訪談豪言，下一代 AI 架構徹底顛覆 Transformer，LSTM 的命運或許再次上演。

Transformer 的最大受益者，親手給它判了死刑！

這幾天，Sam Altman 回到史丹佛，面對一群大二學弟學妹，扔出了一顆深水炸彈——

未來一定會誕生全新的底層架構，性能躍升不亞於當年 Transformer 對 LSTM 的降維打擊。

若影片無法播放，請改看來源頁。

要知道，GPT 帝國就建在 Transformer 上面。

ChatGPT、GPT-4、o1、Codex，全是這套架構的果實。

而現在，摘果子的人親口說：這棵樹的壽命快到頭了。

甚至，奧特曼直言不諱，我們所追求的 AGI 可能只是一次「熱身」（warm up）而已！

而下一代全新架構突破已在路上——現有的高階 LLM 已具備足夠的認知力，能夠作為人類智力槓桿，親手推開另一個技術範式的大門。

用 AI 找到下一個 Transformer

人們都說，暴力出奇蹟，但暴力本身也有極限。

Transformer 有一個天生的算力黑洞：文字長度翻 10 倍，計算量翻 100 倍。

這就是為什麼今天跑 GPT-5.4 等級的模型，燒錢速度是天文數字。

奧特曼顯然看到了這面牆。但他並不覺得沒路走了，恰恰相反，他覺得推翻這堵牆的工具已經到手了。

訪談中有一句極其關鍵的話：現在的模型終於聰明到可以輔助人類去做這種等級的科研了。

意思是，找到下一代架構這件事本身，已經可以讓 AI 來幫忙了。

用當下的 AI 去發現能取代它的新架構，邏輯鏈條很清楚：

模型越強→科研效率越高→新架構被發現的機率越大→新架構反過來讓模型更強。

一個自我加速的飛輪，就這樣形成了。

奧特曼之所以有底氣下這個判斷，跟一路走來對範式轉換的獨特嗅覺有關。

大一暑假，他跑去史丹佛的 AI 實驗室打工，結論是「這些玩意兒根本沒戲」，然後就跑去搞别的創業了。

不過，對 AI 的關注卻從未間斷過。用奧特曼自己的話說，這是一種「抬頭看全局」的習慣，別陷入管中窺豹。

2012 年 AlexNet 橫空出世，他和大多數人一樣，覺得「挺酷的」，但沒往心裡去。

接下來幾年，深度學習模型越做越大、越做越強，奧特曼一直在旁邊看著。直到某個臨界點，感覺徹底變了——這東西簡直像一顆正在逼近的小行星，極其瘋狂，但整個世界居然沒幾個人當回事。

於是 2015 年 OpenAI 成立。核心信念只有一條：把深度學習的規模往死裡推，看看會發生什麼。

但當時說要建 AGI 實驗室，整個行業的老前輩都覺得他們瘋了，甚至直接說他們是騙子。

不過結果大家都看到了。

GPT-2 讓奧特曼第一次見到電腦做出了前所未有的事情，GPT-3 驚艷了世界，GPT-4 更上一層樓。當你站在一個正確的範式上死磕，回報是指數級的。

現在，同樣的直覺被投射到了下一個範式上。

Transformer 不是終點，就像 LSTM 不是終點。

奧特曼甚至給了具體建議：

如果現在是一個研究者，會死磕這個方向，去找「哪裡能挖出核彈級突破」，而且會重度依賴大模型來做科研助手。

Greg 公寓裡的白板

一個改變世界的夜晚

這場訪談最好看的部分，是奧特曼對 OpenAI 草創期的回憶。

OpenAI 第一天上班，大家聚在聯合創始人 Greg Brockman 的公寓裡。

早上 9 點半、10 點，八九個人陸陸續續到了，坐在沙發上，面面相覷。

然後有人開口：「好吧，咱們乾點啥？」

有人提議寫幾篇論文。又有人說得先弄塊白板。然後就有人直接在亞馬遜上下單，加急配送。

奧特曼說當時內心一陣恐慌：這不行啊。這既不像正兒八經的創業公司，也不像任何能成事兒的組織。

但他緊接著說了一句非常奧特曼的話：在那種時刻，你只要深呼吸，相信如果身邊聚的都是最優秀的人，事情總會迎刃而解。

他賭對了。

就在那第一週，後來成為 OpenAI 前四年核心理念的大部分點子，都被寫在了那塊白板上。儘管當時他們自己都覺得這些想法不靠譜。

他們一開始壓根沒想過做產品。

奧特曼反覆強調，他們以為自己就是個純研究實驗室，發發論文就好了。

但後來兩件事變得越來越清晰：

第一，這條路蘊含的經濟價值遠超想像；
第二，需要的資金不是幾十億，而是數以千億計。

而真正讓奧特曼建立起信仰的轉折點，是 GPT-2。

他說不記得 GPT-2 發布那天的具體日期了，但他永遠記得第一次跟那個模型對話的那個夜晚。

它做出了我以前從未見過電腦能做出的事情。

那一刻他覺得，妥了，這就是了。

至於 GPT-2 為什麼暫緩發布？奧特曼承認，事後看來有些過度謹慎，但他覺得面對 AI 每一個新的能力台階，稍微偏向謹慎一點沒壞處。

當然也不能慫過頭。如果企業不以足夠快的速度擁抱 AI，就會被完全自治的 AI 公司幹掉，那才是真正的災難。

史丹佛訪談全景

奧特曼的 10 個判斷

架構預言和創業往事之外，奧特曼在這場訪談中還密集輸出了大量觀點，幾乎每一條都值得單獨拎出來聊。

1. AGI 兩年內降臨。

奧特曼直接告訴台下的大二學生：

等你們畢業的時候，你們將踏入一個已經有 AGI 的世界。

當然，人類的底層驅動力不會變，你還是得搬家、找工作、考慮成家立業。

但科學研究將被高度自動化，創辦初創公司和去大廠打工的意義都將被徹底改寫。

2. 編程智能體是下一個 ChatGPT 時刻。

下一個引爆點是什麼？奧特曼沒猶豫：編程 AI 智能體。

緊隨其後、但尚未完全引爆的，是 AI 在所有知識型工作中執行任務的同等能力。

不過，距離這一天已經不遠了。

3. 一個人能幹出一家中型公司的活兒。

未來會湧現大量一個人或六個合夥人的微型初創公司，影響力和營收甚至能跟今天的中大型企業掰手腕。

奧特曼說 iPhone 問世算是上一次這種級別的機會，這一次更猛。

不僅能做以前不敢想的事，還能用極少的人力極快地把產品和公司建起來。

4. AI CEO？不是不可能。

聊到 AI 對社會的影響，奧特曼說了句耐人尋味的話：

他絕不會自欺欺人地認為，不太遙遠的未來不會出現一個比他更適合執掌 OpenAI 的 AI CEO。

如果有的公司或國家擁抱了 AI 而別人沒有，競爭力差距將是碾壓級的。

這背後的�政治、經濟、社會衝擊，他坦言自己也還沒完全想明白。

5. 但別慌，人類的適應力被嚴重低估了。

奧特曼不是 AI 末日論者。

他反覆強調一個觀點：AGI 聽起來像是要徹底顛覆社會，但身處其中的感覺不會像聽上去那麼驚悚，頂多頭幾天覺得有點懵。

人類渴望對彼此有價值、渴望競爭、渴望創造、渴望表達，這些底層驅動力和不會消失。

也許 100 年後的職業跟今天毫無相似之處，但人永遠有事可做，也永遠在意人與人之間的連接。

6. 別怕跟 OpenAI 競爭。

有人問，OpenAI 變成終極巨頭怎麼辦？

奧特曼的回答出乎意料地坦誠：當年所有人都說不可能跟谷歌打，結果我們打出來了。

總有一天會有比 OpenAI 更大更成功的公司誕生，而他們絕對不會走一模一樣的路。

他甚至說，谷歌當初如果不那麼「拉胯」，OpenAI 根本不可能出頭。

大廠有大廠的通病。

7. 燒錢快，但不慌。

面對「OpenAI 燒錢速度恐怖」的尖銳提問，奧特曼很淡定：燒錢確實快，但如果今年砸 10 億是為了明年賺 30 億，世界上大把資本排隊想做這筆買賣。

8. 自研晶片是認真的，蓋數據中心免談。

OpenAI 有龐大的定製晶片計畫，對自家推理晶片極其興奮。

至於自建數據中心，用奧特曼原話說就是：真的一萬個不想幹這苦力活。

被逼到那一步也會上，但最好是把伺服器機架設計到極致，髒活累活讓別人幹。

9. 社交產品要被撕開一條口子了。

奧特曼覺得 AI 的機會遠不止給現有軟體「塞個 AI 進去」。

他舉了社交產品的例子：想像一堆 AI 智能體代表各自的用戶在虛擬空間自主聊天、交換資訊，這才是底層邏輯的顛覆。

10. 知道很容易，做到更難了。

這是奧特曼部落格第一篇文章裡就寫過的話。

AI 時代還成立嗎？他說比以前更成立了。

獲取知識越來越容易，做成事情雖然也變容易了，但那是對所有人而言的——你得跟全世界一起捲。

他說他認識的那些把 AI 工具玩得最溜的頂尖高手，都覺得自己的工作從來沒有比現在更難。

工具強到離譜，但用好它們以保持頂尖競爭力也前所未有地艱難。

Sam，你真的快樂嗎？

訪談最後一個意外瞬間，是學生的靈魂拷問。

要知道，這是一個每天早上 8 點以後人生就徹底失控的 CEO。

先工作幾小時，陪孩子一小時，然後去公司，從那之後就是純粹的兵荒馬亂。

用他的話說，沒有哪家公司像 OpenAI 這樣跑得這麼快、內部這麼混亂、還死死頂在所有人槍口上。

但奧特曼說，他現在是他認識的人裡最快樂的之一。

他分享了一個改變人生的認知轉變。

大多數人覺得糟糕經歷的反面是美好經歷，所以遇到壞事就痛苦。但他把問題重構了，糟糕經歷的反面，其實是徹底失去體驗的能力。

總有一天你連體驗的資格都沒有了，到那時你甚至會懷念那些被虐的日子。

後 Transformer 賽道

革命已經開始

奧特曼的預言不是空中樓閣。

「後 Transformer」的競賽早就打響了，進展比大多數人想像的快得多。

最高調的挑戰者是 Mamba。

Albert Gu 和 Tri Dao 在 2023 年底提出的這一架構，徹底繞開了「注意力機制」，改用狀態空間模型（SSM）處理序列。

簡單說，Transformer 讀一段話要讓每個詞跟其他所有詞「對視」一遍，Mamba 只維護一個固定大小的記憶狀態，線性時間搞定，推理吞吐量直接快 5 倍。2026 年初 Mamba 已進化到第三代，論文被 ICLR 2026 接收。

產業界的動作更能說明問題。

輝達在 2025 年發布 Nemotron-H 系列，92% 的注意力層被 Mamba 層替換，推理速度提升 3 倍，精度不降反升。

到 2025 年底，輝達全線新模型（Nemotron 3 Nano/Super/Ultra）全部切換到 Mamba-Transformer 混合架構。

AI21 Labs 的 Jamba、IBM 的 Bamba、微軟的 Phi-4-mini-flash-reasoning、LSTM 之父 Sepp Hochreiter 親自操刀的 xLSTM，也紛紛加入混合陣營。

更野的方向也有：Liquid AI 搞出的液態神經網絡（Liquid Neural Networks），靈感來自一條只有 302 個神經元的線蟲。

它用微分方程驅動神經元，推理時還能繼續學習、實時適應環境變化，19 個神經元就能控制自動駕駛。2026 年 1 月發布的 LFM2.5 模型，用遠小於 Transformer 的參數量跑出了驚人的性能。

下一次大遷徙，會誕生誰？

回顧歷史，從 LSTM 到 Transformer 的每一次架構級遷徙，都釋放了一個數量級以上的能力增長，同時也誕生了定義時代的偉大公司。

上一次遷徙，誕生了 OpenAI。下一次呢？

奧特曼自己都說了：總有一天會有比 OpenAI 更大更成功的公司出現。

也許此刻，那個未來的創始人正坐在某個宿舍裡，對著一塊亞馬遜加急配送的白板，寫下第一個不靠譜的想法。

而他手裡多了一個前所未有的利器——AI 本身。

參考資料：https://x.com/rohanpaul_ai/status/2033117083127644536?s=20
https://www.youtube.com/watch?v=FjlymGBt-vY

秒追 ASI

⭐ 點讚、轉發、在看一鍵三連 ⭐

點亮星標，鎖定新智元極速推送！

奧特曼宣判 Transformer 死刑！AGI 兩年內降臨，下一代架構已在路上

相關文章推薦

分享網址