編輯丨&
AI 領域的發展,建立在未來的機器能否實現自我改良之上。1966 年,英國數學家 I. J. Good 寫道:
「一種超智慧機器可以設計出更好的機器;隨後毫無疑問會出現『智慧爆炸』,而人類智慧將被遠遠拋在後頭。」
幾十年來,研究者既期待這種「遞迴自我改良」(recursive self-improvement,RSI),也對它保持警戒。而現在,隨著 AI 能力快速推進,一個問題開始變得現實:這個過程,會不會已經在發生了?
但 RSI 這個詞本身就充滿模糊性。
有人把它當作推動監管的警報詞;有人則把它當成行銷口號。對某些人來說,RSI 意味著一個完全自主的閉環系統;而對另一些人來說,只要「技術幫助製造技術」,就已經算是某種形式的自我改良。
最安全的理解方式,也許是把它看成一個連續光譜。
在最嚴格的定義下,RSI 指的是一種不僅能改良輸出結果,還能改良「自身改良過程」的系統:它能夠自行提出想法、評估結果、修改方法,而且完全不需要人類介入。按照這個標準,今天的大多數 AI 系統仍然達不到要求。它們確實已經能幫助構建更好的 AI,但依然依賴人類來設定目標、定義成功標準,並決定哪些修改值得保留。
真正的問題,不是「自我改良是否已經存在」,而是這個閉環,到底已經閉合了多少。
通往自我改良的臺階
事實上,研究者已經為 RSI 鋪路很多年了。
機器學習演算法早就能夠自動調整程式參數;進化演算法(evolutionary algorithms)可以不斷生成、篩選並疊代設計方案;過去十年裡,AutoML 又開始自動化神經網路結構設計、訓練和評估中的部分流程。
而今天,大型語言模型——例如 OpenAI 的 GPT、Google DeepMind 的 Gemini、Anthropic 的 Claude,以及 xAI 的 Grok——把這一趨勢推得更遠。這些模型最重要的用途之一,就是撰寫程式碼。包括用於生成下一代模型的程式碼。
今年 2 月,OpenAI 表示,GPT-5.3-Codex 已經在自身開發過程中扮演重要角色:協助除錯訓練、管理部署以及分析評測結果。與此同時,Anthropic 也聲稱,其大部分程式碼如今已經由 Claude Code 撰寫。儘管如此,這些系統仍然需要人類來指揮和驗證整個過程。
2025 年,Google DeepMind 還公布了一個名為 AlphaEvolve 的系統——一種「用於科學與演算法發現的編碼智慧體」。它利用大型語言模型引導解空間的進化,例如最佳化神經網路結構、資料中心排程和晶片設計。雖然它依舊需要人類來定義問題和評價標準,但每一次演算法突破,都在反過來提升 AI 研發自身的能力。
圖示:AlphaEvolve 高層次概述。
參與 AlphaEvolve 的電腦科學家 Matej Balog 對此評價道:「這是一個高度協作的過程。」很多時候,人類研究者會從 AI 發現的新方案中反過來獲得啟發。
與此同時,DeepMind 早期晶片設計系統 AlphaChip 的聯合負責人,也創辦了一家名為 Ricursive Intelligence 的新公司,希望利用 AI 來設計 AI 晶片。
聯合創辦人 Azalia Mirhoseini 表示,他們希望把傳統需要一到兩年的晶片設計週期壓縮到「幾天」:
第一階段,AI 輔助人類設計;
第二階段,AI 自動完成沒有專業團隊公司的晶片開發;
第三階段,則是用 AI 設計更好的 AI 晶片,再用這些晶片訓練更強的 AI。
不過,研究團隊強調,這一過程仍會保留人類監管。
還有一些研究,則直接瞄準了「系統修改自身行為」這一目標。比如說去年,英屬哥倫比亞大學(University of British Columbia)與 Sakana AI 發布了 Darwin Gödel Machines(DGMs):一種利用進化演算法不斷改良基於 LLM 的程式碼智慧體的系統。
相關連結:https://spectrum.ieee.org/evolutionary-ai-coding-agents
圖示:DGMs 與超級代理。
雖然它們暫時還無法修改底層語言模型本身,但已經能越來越擅長「改良自己」;更進一步的版本,甚至已經開始修改「自身改良機制」本身。
同一研究團隊後來又開發了 AI Scientist,這個系統旨在嘗試自動化整個科研閉環。它意味著,被自動化的不再只是「編碼」,而是實驗、評估乃至知識生產本身。
智慧爆炸仍然面臨巨大阻力
不過,並不是所有人都認為「奇點」已經近在眼前。
許多研究者指出,如今的 AI 仍然只是「還不錯」地完成生成想法、實作程式碼與評估結果這些步驟,而遠遠稱不上完全自主。
Nathan Lambert 最近提出,與其說未來會出現「遞迴自我改良」,不如說會出現一種「有損自我改良」(lossy self-improvement)。隨著系統越來越複雜,摩擦和協調成本會逐漸拖慢整個飛輪。
相關連結:https://www.interconnects.ai/p/lossy-self-improvement
另一個現實問題則是成本。今天最前沿的 AI 系統開發成本已經達到數十億美元,沒有任何公司願意真的把如此昂貴的系統完全交給 AI 自主運行。
此外,即使 AI 能設計更好的軟體,也不意味著它能夠立刻接管現實世界中的複雜生產體系。真正實現完全 RSI,也許不僅需要 AI 設計晶片和演算法,還需要它建造資料中心、運轉發電系統、開採礦產、管理機器人生產鏈。
而這些能力目前仍然深度依賴人類社會與工業基礎建設。
圖示:自我改良的 AI 與協作式 AI。
「AI 寒武紀」
有些研究者認為,人們對 RSI 的想像方式本身可能就是錯的。
對此,很多人的設想都是一個越來越強大的單一超級 AI,但現實可能更像生物進化。那可能會更像某種人工生命形式的寒武紀大爆發。屆時,大量不同類型的 AI 智慧體會同時出現,它們擁有自己的生態、文化與經濟系統。
但在那時,人類會被剔除出科研迴路嗎?
也許,但可能更慢。
人類研究者會先從低層級工作中退出,不再親自除錯細節,而更像教授或團隊負責人,負責選擇研究方向。之後,人類可能更像專案主管或 CEO,負責制定更宏觀的目標。再往後,人類的角色會逐漸變成監管者。
不過也許,當 AI 進化到能治癒癌症,一些學者大概會很樂意放棄這個令自己喜愛的事業。