如果 AI 開始自我演化：遞迴自我改良正以一種遠比「奇點」更現實的方式浮現

編輯丨&

AI 領域的發展，建立在未來的機器能否實現自我改良之上。1966 年，英國數學家 I. J. Good 寫道：

「一種超智慧機器可以設計出更好的機器；隨後毫無疑問會出現『智慧爆炸』，而人類智慧將被遠遠拋在後頭。」

幾十年來，研究者既期待這種「遞迴自我改良」（recursive self-improvement，RSI），也對它保持警戒。而現在，隨著 AI 能力快速推進，一個問題開始變得現實：這個過程，會不會已經在發生了？

但 RSI 這個詞本身就充滿模糊性。

有人把它當作推動監管的警報詞；有人則把它當成行銷口號。對某些人來說，RSI 意味著一個完全自主的閉環系統；而對另一些人來說，只要「技術幫助製造技術」，就已經算是某種形式的自我改良。

最安全的理解方式，也許是把它看成一個連續光譜。

在最嚴格的定義下，RSI 指的是一種不僅能改良輸出結果，還能改良「自身改良過程」的系統：它能夠自行提出想法、評估結果、修改方法，而且完全不需要人類介入。按照這個標準，今天的大多數 AI 系統仍然達不到要求。它們確實已經能幫助構建更好的 AI，但依然依賴人類來設定目標、定義成功標準，並決定哪些修改值得保留。

真正的問題，不是「自我改良是否已經存在」，而是這個閉環，到底已經閉合了多少。

通往自我改良的臺階

事實上，研究者已經為 RSI 鋪路很多年了。

機器學習演算法早就能夠自動調整程式參數；進化演算法（evolutionary algorithms）可以不斷生成、篩選並疊代設計方案；過去十年裡，AutoML 又開始自動化神經網路結構設計、訓練和評估中的部分流程。

而今天，大型語言模型——例如 OpenAI 的 GPT、Google DeepMind 的 Gemini、Anthropic 的 Claude，以及 xAI 的 Grok——把這一趨勢推得更遠。這些模型最重要的用途之一，就是撰寫程式碼。包括用於生成下一代模型的程式碼。

今年 2 月，OpenAI 表示，GPT-5.3-Codex 已經在自身開發過程中扮演重要角色：協助除錯訓練、管理部署以及分析評測結果。與此同時，Anthropic 也聲稱，其大部分程式碼如今已經由 Claude Code 撰寫。儘管如此，這些系統仍然需要人類來指揮和驗證整個過程。

2025 年，Google DeepMind 還公布了一個名為 AlphaEvolve 的系統——一種「用於科學與演算法發現的編碼智慧體」。它利用大型語言模型引導解空間的進化，例如最佳化神經網路結構、資料中心排程和晶片設計。雖然它依舊需要人類來定義問題和評價標準，但每一次演算法突破，都在反過來提升 AI 研發自身的能力。

圖示：AlphaEvolve 高層次概述。

參與 AlphaEvolve 的電腦科學家 Matej Balog 對此評價道：「這是一個高度協作的過程。」很多時候，人類研究者會從 AI 發現的新方案中反過來獲得啟發。

與此同時，DeepMind 早期晶片設計系統 AlphaChip 的聯合負責人，也創辦了一家名為 Ricursive Intelligence 的新公司，希望利用 AI 來設計 AI 晶片。

聯合創辦人 Azalia Mirhoseini 表示，他們希望把傳統需要一到兩年的晶片設計週期壓縮到「幾天」：

第一階段，AI 輔助人類設計；

第二階段，AI 自動完成沒有專業團隊公司的晶片開發；

第三階段，則是用 AI 設計更好的 AI 晶片，再用這些晶片訓練更強的 AI。

不過，研究團隊強調，這一過程仍會保留人類監管。

還有一些研究，則直接瞄準了「系統修改自身行為」這一目標。比如說去年，英屬哥倫比亞大學（University of British Columbia）與 Sakana AI 發布了 Darwin Gödel Machines（DGMs）：一種利用進化演算法不斷改良基於 LLM 的程式碼智慧體的系統。

圖示：DGMs 與超級代理。

雖然它們暫時還無法修改底層語言模型本身，但已經能越來越擅長「改良自己」；更進一步的版本，甚至已經開始修改「自身改良機制」本身。

同一研究團隊後來又開發了 AI Scientist，這個系統旨在嘗試自動化整個科研閉環。它意味著，被自動化的不再只是「編碼」，而是實驗、評估乃至知識生產本身。

智慧爆炸仍然面臨巨大阻力

不過，並不是所有人都認為「奇點」已經近在眼前。

許多研究者指出，如今的 AI 仍然只是「還不錯」地完成生成想法、實作程式碼與評估結果這些步驟，而遠遠稱不上完全自主。

Nathan Lambert 最近提出，與其說未來會出現「遞迴自我改良」，不如說會出現一種「有損自我改良」（lossy self-improvement）。隨著系統越來越複雜，摩擦和協調成本會逐漸拖慢整個飛輪。

另一個現實問題則是成本。今天最前沿的 AI 系統開發成本已經達到數十億美元，沒有任何公司願意真的把如此昂貴的系統完全交給 AI 自主運行。

此外，即使 AI 能設計更好的軟體，也不意味著它能夠立刻接管現實世界中的複雜生產體系。真正實現完全 RSI，也許不僅需要 AI 設計晶片和演算法，還需要它建造資料中心、運轉發電系統、開採礦產、管理機器人生產鏈。

而這些能力目前仍然深度依賴人類社會與工業基礎建設。

圖示：自我改良的 AI 與協作式 AI。

「AI 寒武紀」

有些研究者認為，人們對 RSI 的想像方式本身可能就是錯的。

對此，很多人的設想都是一個越來越強大的單一超級 AI，但現實可能更像生物進化。那可能會更像某種人工生命形式的寒武紀大爆發。屆時，大量不同類型的 AI 智慧體會同時出現，它們擁有自己的生態、文化與經濟系統。

但在那時，人類會被剔除出科研迴路嗎？

也許，但可能更慢。

人類研究者會先從低層級工作中退出，不再親自除錯細節，而更像教授或團隊負責人，負責選擇研究方向。之後，人類可能更像專案主管或 CEO，負責制定更宏觀的目標。再往後，人類的角色會逐漸變成監管者。

不過也許，當 AI 進化到能治癒癌症，一些學者大概會很樂意放棄這個令自己喜愛的事業。

原文連結：https://spectrum.ieee.org/recursive-self-improvement

如果 AI 開始自我演化：遞迴自我改良正以一種遠比「奇點」更現實的方式浮現

相關文章推薦

分享網址