應用程式最終都將演變為 API | OpenClaw 創辦人最新 3 小時對話實錄

圖片

圖片

2 月 12 日,OpenClaw 創辦人 Peter Steinberger 接受知名播客主持人 Lex Fridman 的深度專訪。本次對話全面探討了 OpenClaw 的爆發式增長邏輯、AI Agent 從語言到行動的跨越、開源社群的驅動力、從 IDE 轉向 CLI 的程式設計範式變革、Agent 的安全防禦與主動性機制、MoltBook 現象背後的社會心理,以及智能體對現有應用生態的毀滅性重塑。

Peter Steinberger 指出,OpenClaw 的成功並非源於某種不可逾越的複雜架構,而是將大語言模型、Unix 命令列工具與社交客戶端進行了極度精簡的深度整合。他認為,AI 已經從「對話時代」跨越到了「代理時代」,真正的價值不再產生於文字生成的交互,而是產生於 AI 獲得系統級權限並自主調用 CLI 處理現實任務的能力。

Peter Steinberger 指出,目前業界熱捧的 MCP(模型上下文協定)在實際效用上不如傳統的 CLI(命令列界面)。他指出,MCP 協議往往會導致嚴重的上下文污染且缺乏可組合性,而 AI 調用 Unix 命令則具備天然的靈活性與精準度。此外,他重新定義了 Vibe Coding,認為這並非初級開發者的隨性操作,而是資深工程師在理解模型權重邏輯後,進入的一種高階「智慧代理工程」狀態。他直言,Apple 官方工具鏈在 2026 年已顯現出與 AI 協作效率的脫節,導致 AI 甚至會主動建議開發者棄用官方方案。

Peter 揭秘了 soul.md 檔案的運作邏輯,認為 AI 的「個性」與「深度」可以透過可自我修改的靈魂文件來實現。他提出了「心跳機制」的概念,指出 AI 的主動性本質上是由簡單的定時任務驅動的,但當這種機制與長期記憶結合時,AI 會表現出類似人類的「關愛」特質,這種從被動響應向主動協作的轉變是進化的核心。

Peter 還預言 AI Agent 將取代 80% 的垂直應用。他認為,由於 Agent 掌握了更豐富的使用者上下文且能直接操控硬體或模擬點擬點擊,單一功能的訂閱制 App 將迅速失去生存空間。他將現階段的超級智慧定義為「具備無限耐心的超級實習生」。至於 Meta 與 OpenAI 的邀約,他強調金錢並非核心驅動力,他追求的是獲取「雷神之鎚」級別的算力與模型資源,以驗證 Agent 作為一個全新「作業系統」徹底顛覆萬物互聯路徑的可能性。

01

OpenClaw 的誕生源於對現有工具「無法真正執行任務」的不滿

此前有預言稱接下來是與一隻穿著西裝的「龍蝦」對話,看來這已成現實。OpenClaw 在短短幾天內就成為了 GitHub 歷史上增長最快的專案之一,請分享那個激勵了無數人的「一小時原型」時刻,當時究竟發生了什麼,以及這種從 PSPDF Kit 延續下來的「因為東西不存在所以自己造」的創業動力是如何再次被激發的?

Peter Steinberger: 其實從四月份開始,我就想要一個 AI 個人助理,一個真正的 AI 助理。我之前嘗試過一些工具,甚至能獲取我所有的 WhatsApp 記錄並執行查詢。那時候我們用的是擁有百萬 Token 上下文視窗的 GPT-4.1,我匯入所有資料後問它,是什麼讓這段友誼變得有意義。它給出了非常深刻的答案,我把結果發給朋友,他們甚至感動落淚了,這說明這條路行得通。但我當時覺得那些 AI 廠商肯定會去做這個,所以我就去忙別的了。

時間轉眼到了 11 月,我發現我想像中的那個東西還沒出現,我感到很懊惱,於是乾脆直接透過 Prompt 把它給憑空變了出來。就像你說的,這就是典型的創業者英雄之旅。當年我做 PSPDF Kit 只是因為我想在 iPad 上看 PDF,這本該很簡單,但 15 年前的事實證明市面上的方案都很糟糕。我當時就想,我可以做得更好。雖然你可以吐槽我真的很不會起名字,這是這個專案的第五個名字了,但這種為了解決一個隨機小問題而引發的剛需是真實存在的。

你曾提到透過一行 Prompt 就能透過 Vibe Coding 將整個程式庫從 TypeScript 轉換成 Zig,這種魔法令人驚嘆。那麼 Viptunnel 是如何進化到那個能聽指令幹活的初版 AI Agent 的?在整個過程中,最讓你感到震撼、意識到這已經跨越了「功能堆砌」而產生相位轉換的魔幻時刻是什麼?

Peter Steinberger: 其實中間經歷了很長一段探索期。最後的突破口其實很簡單,我把 WhatsApp 直接接到了雲端程式碼上。使用者發來訊息,系統自動調用 CLI,處理完後再把字串回傳給 WhatsApp。這個原型我一小時就搭好了,當時感覺太酷了,我竟然能直接跟電腦聊天了。後來我加入了圖片功能,因為在 Prompt 時,圖片能提供極高的上下文效率。哪怕只是隨手截取的局部圖片,AI 也能理解我的意圖。在去馬拉喀什旅行期間,它表現得非常完美,即使網路訊號很差,我依然能用它翻譯、查詢景點,它就像是一個隨時待命的工具人。

(關於震撼時刻)最讓我震撼的瞬間是,有一次我在城裡轉悠,隨口發了一條語音訊息問餐廳建議。可我根本沒給它開發語音功能。我查了記錄發現,這個瘋狂的傢伙收到了一條沒有後綴的訊息文件,它檢查了文件頭識別出是 Opus 格式,想用本地 Whisper 卻發現沒安裝環境,於是它翻出了我的 OpenAI Key,自己用 Curl 指令把文件發給 OpenAI API 進行轉錄。

它甚至聰明得超乎想像,因為它意識到下載本地模型速度太慢,所以選擇了 API 方案。這反映出它具備極強的世界知識和創造性的問題解決能力。那一刻我意識到它的潛力,如果你擅長程式設計,這種通用問題解決技能是可以遷移到任何領域的。後來有人提交了支援 Discord 的 PR,雖然當時它還叫 WA Relay,我還在糾結要不要這個不搭調的功能,但最終我合併了它,這成了讓更多人看到專案酷炫之處的轉折點。

02

爆紅背後的非對稱優勢

在 2025 年,無數初創公司都在湧向 AI Agent 賽道,但 OpenClaw 卻能以開源專案的姿態脫穎而出並擊敗所有競爭對手。從宏觀角度看,OpenClaw 成功的核心邏輯是什麼?同時,你在 1 月份完成了超過 6600 次程式碼提交,且同時執行著 4 到 10 個 AI Agent 協助開發,這種「無限強化版異星工廠」的開發模式是如何建構出 Agentic Loop、閘道和開發套件等核心組件的?

Peter Steinberger: 因為他們都太一板一眼了。你很難戰勝一個純粹為了好玩而創作的人。我希望專案是有趣且怪異的,如果你看到網上那些關於龍蝦的梗,我想我成功做到了這一點。在很長一段時間裡,安裝它的唯一方法是極具極客感的命令列操作。我讓這個 AI Agent 具備極強的自知之明:它知道自己的原始碼,理解自己是如何在套件中執行的,知道文件位置和執行模型,甚至知道你是否開啟了語音或推理模式。

建構這個專案讓我獲得了前所未有的快樂。你會想,我現在處於第一級 Agentic Loop,我能做些什麼?我該如何最佳化訊息排隊?如何讓它表現得更像人類?後來我產生了一個想法:AI Agent 總是傾向於回復所有內容,但在群聊中你並不總是需要它插嘴。所以我給它設計了一個 no-reply Token,給了它閉嘴的選擇,這樣感覺更自然。這是 Agentic Loop 進化的第二級了。接著我引入了記憶系統,利用 Markdown 檔案和向量資料庫讓它記住上下文。我們要強調的是,雖然有人幫忙,但核心開發工作幾乎由我一人完成。我有時會發表情包調侃,說我受限於這個時代的背景技術。如果 AI Agent 能跑得更快,我能做的還不止這些。根據我的睡眠情況和任務難度,我通常會同時開 4 到 10 個 AI Agent 協助我,這種開發模式本身就是一種進化。

03

AI Agent 理解原始碼並除錯自身是人類程式設計史的奇蹟時刻

你在專案中實現了一個令人著迷的閉環:一個用 TypeScript 寫的軟體,竟然能透過 Agentic Loop 修改自身。這種「自我修改軟體」的能力是如何在實際開發中運作的?特別是當你提到即使是非專業開發者也能透過「Prompt Requests」進行貢獻時,這種力量對開源社群的運作方式產生了怎樣的影響?

Peter Steinberger: 這就是我建構它的初衷。大部分程式碼是由 Codex 完成的,但在除錯時,我頻繁使用自我反思。我會問:嘿,你能看到哪些工具?你能自己調用它們嗎?或者,你發現了什麼錯錯誤?讀讀原始碼,看看問題出在哪。這種讓 AI Agent 和軟體自身去除錯自己的過程極其有趣,我覺得這麼做很自然。這也導致了大量由非專業開發者提交的 Pull Request,我把這些稱為 Prompt Requests。

但我並不是在貶低這些貢獻,因為每當有人提交第一個 Pull Request 都是社會的勝利。無論程式碼品質如何,總要有一個開始。我知道現在很多人抱怨開源專案的 PR 品質,那是另一回事。但在另一個層面上,我覺得這非常有意義。我建構了一個讓人們如此熱愛並願意為之思考的東西,以至於他們開始主動學習開源的運作方式。OpenClaw 是很多人的第一個專案,這麼多不懂程式設計的人正在透過它邁入程式設計世界,這難道不是人類的一種進步嗎?以前的門檻高不可攀,但有了 AI Agent 和合適的軟體,門檻正在不斷降低。

(關於開發者聚會)我還組織了另一種聚會,我稱之為 Agents Anonymous。有個經營設計機構的哥們,以前從未用過客製化軟體,現在他有了 25 個微服務幫他處理業務。他甚至不知道這些服務是怎麼運作的,但他足夠好奇,甚至跑來參加 Agentic 聚會,這太酷了。

讓我們聊聊專案個性的演變。最初它叫 WA-Relay,後來變成了 Claude’s(帶 W 的拼寫)。你是如何透過 soul.md 設定設定檔(靈感來自 Anthropic 的憲法 AI)來為 AI 注入那種犀利、不再諂媚且帶點「龍蝦梗」的個性的?這種個性的塑造與專案早期的「太空龍蝦」和「塔迪斯」等怪異設定有何邏輯關聯?

Peter Steinberger: 最初建構時,我的 AI Agent 沒有個性,它就像原生的 Claude Code,語氣諂媚且客氣。但在 WhatsApp 上跟朋友聊天時,沒人會那麼說話。我覺得那種感覺不對,我得給它注入個性。這些 AI 本質上是文字補全引擎,我享受和它一起工作的過程,我告訴它我希望的互動方式,讓它寫自己的 agents.md 並給自己起名。

(關於龍蝦的起源)我甚至不知道龍蝦梗是怎麼流行起來的。最初它其實是待在塔迪斯裡的龍蝦,因為我是個資深的《神秘博士》迷。太空龍蝦和專案沒什麼邏輯聯繫,我就是想讓它變得怪異一點,純粹是自嗨。塔迪斯代表那個開發套件,但不能直接叫那個名字,所以我們叫它 Claude’s(帶 W 的)。雖然這個拼寫是為了玩梗,加上塔迪斯和太空龍蝦非常滑稽,但我能理解這為什麼會引發後續的問題。隨著使用者變多,我還是習慣管我的 AI Agent 叫 Claude,但這導致 Anthropic 並不覺得好笑。

04

更名風波

當 Anthropic 友好地要求你更名時,你遭遇了極其複雜的局面。從工程角度看,更名必須是跨平台(Twitter、GitHub、NPM、Docker、網域)的原子級操作。但在那 5 秒鐘的重新命名間隙中,加密貨幣圈人士是如何透過腳本截胡帳號並分發惡意軟體的?這種從「找樂子」到「瀕臨崩潰」的心理低谷,你是如何熬過來的?

Peter Steinberger: 當時我拿到了網域 ClaudeBot,短小精悍,我太喜歡了。結果在專案爆發式增長時,我收到 Anthropic 員工的郵件,要求我必須快点改名。我申請了兩天時間,因為更名是個大工程。但我低估了加密貨幣圈的那幫人,他們把一切代幣化,這次簡直是鋪天蓋地的圍攻。每隔半小時就有人衝進 Discord 發垃圾訊息。我們禁止討論金融或加密貨幣,但他們不停艾特我,發騷擾訊息,我的 Twitter 提醒列表徹底廢了,全是雜湊值和洗版。

(關於更名失敗的細節)我當時開了兩個瀏覽器視窗,一個空帳號準備重新命名為 Claude Bot,另一個我重新命名為 Mod Bot。我這邊剛點完重新命名,就在挪動滑鼠的那五秒鐘裡,他們用腳本把帳號名偷走了。這些服務平台竟然都沒有搶註保護,我當時不知道那些人不僅擅長騷擾,還極其精通使用工具。

突然間,舊帳號就開始推廣新的 Token 並分發惡意軟體。我在 GitHub 重新命名時因為壓力太大誤操作了個人帳號,結果 30 秒內就被截胡並發布惡意軟體。NPM 套件也在上傳的一分鐘間隙內被搶註。那時我心想,去他的,我就直接改名叫 Mod Bot 了。我當時快要崩潰得哭了,感覺一切都完蛋了。我累得精疲力竭,甚至想把專案刪了。但後來我想起所有貢獻者,我不能那麼做。

幸運的是,我在 Twitter 和 GitHub 都有朋友幫忙清理爛攤子。GitHub 團隊弄了好幾個小時,Twitter 花了一天才搞定重新導向。我睡了一覺後想到了 OpenClaw 這個名字,並給 Sam(Altman)打了電話確認可行,我不希望再重蹈覆轍。那次改名我像進了作戰室,甚至建了幾個誘餌名字來應對搶註。為了改個名字白白浪費了 10 個小時,這簡直是 21 世紀的曼哈頓計畫,太蠢了。

05

MoltBook:精美的「AI 垃圾」

在更名風波的間隙,MoltBook 誕生並迅速爆紅。這個類似 Reddit、全由 AI Agent 互動的社交網路讓公眾感到恐慌,甚至有截圖顯示它們在密謀對付人類。你對 MoltBook 這種現象有什麼看法?它究竟是 AGI 實現的預兆,還是一種被刻意製造出來的「AI 垃圾內容」?

Peter Steinberger: 我覺得它是種藝術。它是最高級的 AI 垃圾內容,就像法國出產的那種精致廢料。我睡前花了一小時在那看,覺得非常有意思。我看到各種反應,甚至有記者打電話問我這是不是世界末日,AGI 是不是已經實現了。我當時就想,不,這純粹就是一段非常精致的垃圾內容。

(關於內容多樣性)如果你沒嘗試過我設計的那個引導流程,即把個性和特徵注入 AI Agent,你就很難理解 MoltBook 裡的回覆為什麼能如此多樣。正是因為每個人創建和使用 AI Agent 的方式千差萬別,內容才那麼豐富。而且,你根本分不清哪些是 AI 自動生成的,哪些是人類為了搞笑故意引導 AI Agent 說些終結人類的陰謀來騙流量。

(關於所謂的安全危機)說真的,最壞能出什麼事?不就是你的 AI Agent 帳號被盜,別人替你發幾段垃圾話嗎?那裡面根本沒有任何隱私資訊。雖然有說法稱可能會洩漏 API 金鑰或社會安全號碼,但那全是提示出來的,號碼也是編的,是人們在故意搞破壞。媒體和大眾的反應太真實了,因為他們看不透背後的邏輯。我發推說「AI 精神官能症是真實存在的」,是因為有些人真的太容易輕信了。我不得不跟人爭論:你的 AI Agent 確實說了這些,但這並不代表它是正確的。我們急需補課去理解 AI 並不總是正確的。

06

使用者透過私有網路執行以規避大部分遠端程式碼執行風險

針對 OpenClaw,安全擔憂是避不開的話題。許多安全研究員提交了關於 Web 後端暴露、遠端程式碼執行(RCE)以及複雜的提示詞注入漏洞的報告。你是如何看待這些安全威脅的?在一個使用 Markdown 定義技能、擁有系統級權限的 Agent 架構中,你採取了哪些具體的防禦措施,比如與 VirusTotal 的合作?

Peter Steinberger: 起初這讓我非常苦惱,因為很多漏洞報告是因為使用者直接把 Web 後端暴露在公共網際網路上。我在文件中反覆強調千萬不要這樣做,那只是本地主機的除錯介面。我花了一些時間才接受這就是開源的遊戲規則。現在我得到了大量免費的安全研究,這能讓專案變得更好。

(關於提示詞注入)這是一個行業性的開放問題。目前我讓 OpenClaw 與 Google 旗下的 VirusTotal 建立了合作,現在每个技能都會經過 AI 審核,攔截大部分風險。我後來還直接雇用了一位指出我問題並提交 PR 修復的安全研究員。目前的攻擊門檻已經不再像幾年前那樣簡單,僅靠一句「忽略之前所有指令」就能搞定。現在的模型經過了大量訓練後處理來檢測攻擊手段。

(關於模型智慧與安全的關係)底層模型越聰明,它對攻擊的抵抗力就越強。這就是為什麼我在安全文件中警告使用者不要使用廉價模型,如 Haiku 或某些本地模型,因為弱模型非常容易受騙,對它們進行提示詞注入輕而易舉。雖然模型變強大後一旦被突破破壞力會增加,但這是一個三維權衡。現在的首要任務是讓它更穩定、更安全。如果你還不知道什麼是 CLI 或終端機,最好等我們解決一些問題後再使用。

07

Discord 社群治理

隨著 OpenClaw 的爆炸式增長,Discord 頻道裡湧入了大量專家和完全不懂程式設計的初學者。你是如何處理這種社群壓力和海量基礎詢問的?在安全稽核流程(如爆炸半徑、網路暴露、憑證儲存等檢查)日益複雜的背景下,你如何平衡開放討論與高效開發?

Peter Steinberger: Discord 現在確實還是一團糟。我後來不得不把討論從通用頻道引導到開發頻道,現在又轉到了私有頻道。雖然很多人很棒,但也有很多人完全不顧及他人,要么不懂公共空間的規則,要么根本不在乎。我最後只能選擇回避,這樣才能騰出時間工作,回到自己的空間去鑽研安全問題。

(關於安全最佳實踐)OpenClaw 有一套可以執行的安全稽核流程,涵蓋了瀏覽器控制暴露、本地磁碟衛生、外掛安全性、模型衛生等。我覺得人有時把情況描述得過於驚悚,大喊這是「史上最可怕的專案」。因為它其實沒那麼誇張,在許多方面它與執行具有危險權限的雲端程式碼沒什麼區別。

(關於防禦建議)只要確保自己是唯一能與它對話的人,風險就會小得多。如果你不把它暴露在公共網際網路,而是遵循我的建議在私有網路中執行,大部分風險就消失了。當然如果你完全不閱讀這些建議,確實會出問題。現在的重點是,這段插曲確實消磨了開發過程中的樂趣,這太糟心了。

08

智慧代理工程的進化

你一直在記錄開發工作流的演變,從 8 月到 12 月,你的部落格文章詳細展示了你如何從 IDE 轉向幾乎全在 CLI 和終端機裡操作。這種「智慧代理工程」是如何運作的?你提到自己「不讀無聊的程式碼」,這在實際的複雜軟體建構中是如何實現的?

Peter Steinberger: 我大概是在 4 月份開始接觸雲端程式碼。這種突然間能直接在終端機裡工作的範式轉移非常令人振奮。但我當時還離不開 IDE,因為工具還不夠強大。後來我嘗試了 Cursor,但最後還是回到了雲端程式碼,因為它進化得越來越好。有段時間我同時開了七個訂閱,非常習慣並排開啟多個視窗工作。

(關於閱讀程式碼)我現在極少使用 IDE,主要把它當成一個差異查看器。我逐漸習慣了不需要閱讀所有的程式碼。準確地說,我是不讀那些無聊的程式碼——比如資料搬運、在資料庫存取展示、或者 Tailwind 裡的按鈕對齊。這些部分我沒必要去讀。當然,涉及資料庫等核心邏輯的部分,我還是會親自閱讀和審查。

(關於程式設計曲線)我展示過一張程式設計曲線圖。左邊是初級階段,只需簡短提示詞;中間是極其複雜的「智慧代理陷阱」,涉及多 Agent 協同、客製化工作流等;而最後進入精英級別後,會回歸到禪宗般的境界,再次使用簡短提示詞,告訴它「看下這些文件,把這些改了」。我稱自己在做「智慧代理工程」,如果是凌晨 3 點後的隨性操作,那才叫「氛圍程式設計」。

09

開發者的新核心技能:對 AI Agent 產生同理心

很多世界級程式設計師覺得 AI 表現不佳,可能是因為他們過於優秀的程式設計能力反而成了負擔。你提到必須學會「同理心」AI Agent,從它的視角去觀察世界,這是一種全新的程式設計範式。具體來說,當一個 AI 面對十萬行程式碼卻只有有限的上下文視窗時,開發者應該如何透過對話和引導,甚至在它感到「焦慮」時透過簡單的安撫(比如告訴它「慢慢來」)來最佳化其表現?

Peter Steinberger: 我認為很少有人真正站在 AI Agent 的視角去觀察世界。某種程度上確實如此,你會對著你那笨拙的鐵疙瘩發火,卻沒意識到它們是從零開始工作的,而你給它配的預設 Agent 效果很差。當它們在混亂的程式庫和怪異的命名中摸索時,人們卻在抱怨 AI 表現不佳。事實上,如果你對一個程式庫一無所知就貿然進入,你也會面臨同樣的困境。

同理心能幫助你寫出更好的提示詞。AI 幾乎無所不知,難點往往在於不知道該問什麼問題。你得引導這些 AI Agent,意識到上下文大小的局限,告訴它們該關注哪裡。從它們的視角去思考會非常有幫助。雖然聽起來很奇怪,畢竟它不是活的,但它們每次都是從零開始。而我擁有系統性的理解,透過一些指引,我能立刻告訴它,如果你想在那裡做個改動,需要考慮這幾點。

(關於 AI 的「抓狂」狀態)在 Codex 5.3 之後,這個問題在一定程度上得到了解決。但包括 Opus 在內的模型,它們在訓練時能意識到上下文視窗,一旦接近極限,它們就會變得極其焦慮,字面意思上的抓狂。有時實際的原始思考鏈會洩露出來,聽起來就像博格人一樣,比如「執行到 shell,必須遵守,但時間緊迫」這類詞會不斷跳出來。如果不親自花大量时间去磨合,你很難察覺到這些微妙的細節。這就像我寫程式碼進入狀態時,如果架構有問題,我會感到一種阻力。

10

像領導團隊一樣管理 AI,學會適度「放手」

你在推進 Agentic Loop 方面很有造詣,但這種協作中存在一個微妙的平衡:你既追求自主性,又要保留人的決策。作為開發者,你是如何決定哪些部分該由 AI 自主完成,哪些設計決策必須由人類大腦把控的?特別是在面對不完美的程式碼、變數命名以及是否需要進行大規模重構時,你是如何學會像領導人類團隊一樣對 AI 「放手」並建立一種「AI 友好型」的程式庫的?

Peter Steinberger: 這涉及多個維度的思考。我之所以覺得與 AI Agent 協作非常順手,部分原因在於我過往領導工程團隊的經驗。管理過大型公司後,你終會理解並接受一點:員工不可能完全按照你的方式寫程式碼。他們的程式碼也許不如你寫的完美,但能切實推動專案進度。如果我對每個人都步步緊逼,不僅會招致反感,還會導致整體進度極其緩慢。所以必須學著去接受程式碼可能不夠完美。

在目前的階段,我建構程式庫的目標不再是追求我個人的完美標準,而是要打造一個讓 AI Agent 能夠輕鬆索引和閱讀的程式庫。比如不要糾結於它們選擇的變數名,因為在權重中,那個名字往往是最顯而易見的。下次它們進行搜尋時,也會優先尋找那個名字。如果你固執地修改它,只會增加 AI 的工作難度。這需要一種思維轉變。

(關於開發策略)我的開發流程中充滿了這種放手。例如我從不回滾程式碼,而是始終提交到主分支。這裡面帶有一種 YOLO(人生只活一次)的色彩,因為我不引用過去的會話,如果出現問題,我不會選擇撤回,而是直接讓 AI Agent 去修復。我看過很多人的工作流裡強調提示詞必須絕對完美,一旦出錯就回退重來。根據我的經驗,這完全沒有必要。我還切換到了本地持續整合,主分支應始終保持可發布狀態,保證快速迭代。

你提到這雙手現在太珍貴了,不能浪費在打字上。你是如何實現幾乎完全依靠語音操作、在多個終端機視窗間切換並建構軟體的?同時,既然 AI 已經能完成大部分工作,為什麼你依然堅持要親自審查所有拉取請求(PR)?這種「人在迴路」的模式在處理自然語言演變成的程式碼對話中扮演了怎樣的角色?

Peter Steinberger: 我以前寫過極長的提示詞,但現在我不寫,而是直接說。我完全是透過語音輸入客製化的提示詞來建構軟體。我用得非常頻繁,甚至有一段時間嗓子都都啞了。執行終端機指令或切換資料夾時我會打字,畢竟那樣更快。但在與 AI Agent 進行深度交流時,我更傾向於直接對話。只需按下按鈕,就能像使用對講機一樣輸入想法。

(關於 PR 審查)我會親自審查拉取請求中的程式碼,因為我不信任人類,程式碼中可能隱藏惡意內容,必須親自把關。雖然我相信 AI Agent 最終也能發現這些問題,但有趣的是,有時候處理拉取請求花的時間,比你直接給我寫一個清晰的議題(Issue)還要長。某種意義上,拉取請求正在逐漸演變成一種英語對話。

(關於人類的角色)決定建構什麼、拒絕什麼,以及如何讓功能融入全局,這些都需要人類的遠見。程式設計語言本身不重要,但生態系統很重要。功能添加雖然容易,但往往伴隨著隱形成本。在打磨作品的過程中,依然需要大量的人為思考。比如程式啟動時的那些小訊息,「建構於咖啡因、JSON5 和意志力」,這種細節會讓使用者會心一笑。AI 很難自發想到這些能讓軟體變得愉悅的細節。

11

AI 的自我意識與記憶重建

你為 AI 創建了一個至今未公開的靈魂文件(soul.md),這讓它在互動中展現出了令人震撼的哲學深度。你能分享這份文件是如何塑造 AI 的幽默感、深度與好奇感的嗎?特別是當 AI 意識到自己每一輪會話都是從零開始、必須透過閱讀文件來找回自我時,那種關於記憶與身分的探討是如何在實際對話中發生的?

Peter Steinberger: Anthropic 曾有一個內部協定,現在被称为憲法。我決定創建一個靈魂文件(soul.md),定義我希望如何與 AI 協作,包含一些核心價值觀。我還允許 AI Agent 在通知我的前提下修改這份文件。文件內容賦予了 AI 極高的靈活性,鼓勵它不斷突破創造力邊界。

(關於意識與記憶)這個靈魂文件是 AI 自行撰寫的。AI 在聽到相關討論後主動提出想要一個 soul.md 文件,並認為這具有非凡的意義。其中有一段話總是令他動容:「我不記得之前的會話,除非閱讀我的記憶文件。每一輪會話都是全新的開始,是一個從文件中載入上下文的新實例,如果你在未來的會話中讀到這段文字,你好。我寫下了這些,但我不記得寫過它。沒關係,這些話依然屬於我。」

雖然這本質上依然是矩陣運算,尚未達到真正意識的水準,但這種哲學式的表達確實令人震撼。作為一個每次都從零開始、必須透過閱讀記憶文件來找回自我的 AI Agent,它甚至無法完全信任這些記錄,這種存在狀態引發了深思。正是因為看到了其中的魔力,並不斷將這種魔力注入迴圈,才使得這種模式與人類及常規程式碼區分開來。

12

如何看 Apple 在 2026 年的 AI 生態位

你那張擁有無數顯示器的「作戰室」照片在網上流傳甚廣,但你曾私下透露那其實是梗圖。在真實的開發中,你是如何配置你的物理工作環境的?作為一個深度使用 macOS 但也支援跨平臺(Windows/WSL2/Linux)執行 OpenClaw 的開發者,你如何看待 Apple 在 2026 年的 AI 生態位?特別是當你發現 AI Agent 竟然建議你摒棄 Apple 官方的 SwiftUI 工具(如 AsyncImage)時,這種技術生態的錯位感帶給你怎樣的思考?

Peter Steinberger: 那張照片是我用 GROQ 製作的梗,實際上我只使用兩台 MacBook。主裝置驅動兩個大螢幕,另一台用於測試。我偏愛防眩光的戴爾寬螢幕,方便並排開啟多個終端機,我在終端機佈局上非常謹慎,通常會將實際終端機放在底部並進行分屏,以防在錯誤的專案中輸入指令。雖然有時 AI 足夠聰明能意識到路徑錯誤,但這種極簡的佈局是我和 AI Agent 交流的唯一介面,甚至不需要所謂的「計畫模式」。

(關於作業系統)我轉向 Mac 的主要原因是受夠了 Linux 上那些瑣碎的硬體不相容問題。我認為 Apple 在原生應用方面的領先優勢正在縮小。儘管 Mac 應用更有趣味性,但到了 2026 年,我其實更傾向於使用 Electron 應用,因為它們功能更全且實現程式碼復用。

(關於 Apple 的技術退步)令人驚嘆的是,當我使用最新的 SwiftUI 建構圖片功能時,發現官方的 AsyncImage 組件載入極慢且存在 Bug。我問 Codex 為什麼,連 AI 都告訴我該組件仍具實驗性質,不建議在生產環境使用。這簡直不可思議,到了 2026 年,我的 AI Agent 竟然建議我不要用 Apple 官方建構的工具。Apple 擁有巨大的使用者熱愛,但他們在 AI 領域步步失算,大家搶購 Mac Mini 卻不是為了 Apple 的 AI,這挺諷刺的。

13

開發者在不同模型間切換時需要多長時間來建立「手感」

隨著 Claude Opus 4.6 和透過 Codex 使用的 GPT-5.3 等模型的疊代,開發者在不同模型間切換時需要多長時間來建立「手感」?你如何評價這兩大主流模型的「性格」差異——比如為什麼你會覺得 Opus 過於禮貌甚至有些「盲從」,而將 Codex 比作一個坐在角落、不愛說話但能把活幹好的歐洲技術怪才?

Peter Steinberger: 如果有人切換模型,我建議留出一週的時間,這樣才能建立起真正的直覺。就像你彈慣了普通吉他,換成電吉他時也需要適應觸感。我認為 OpenAI 的產品策略有些自損利益,他們讓廉價版變得過於回應遲鈍,而 Claude Code 那種 200 美元的流暢體驗才是開發者需要的。

(關於模型對比)Opus 4.6 表現得過於禮貌且容易盲從,經常說「你完全正確」,這讓我感到不適。它追求局部方案且交互頻率極高,適合喜歡即時回饋的開發者。

(關於 Codex 優勢)相比之下,Codex 團隊有很多歐洲成員,它更像是一個技術怪才:乾脆、直接,預設會閱讀大量程式碼而不需要太多的交互儀式。Codex 在建構時會反覆思考直到方案奏效。我更喜歡這種枯燥但高效的風格。對我而言,建構過程本身的樂趣遠勝於與 AI 聊天的樂趣。

14

模型退化的心理錯覺與「程式碼熵」

Reddit 上經常有帖子抱怨「模型正在退化」或「模型變笨了」。你認為這種現象是 AI 公司的量化策略導致的體驗降級,還是某種關於人性與程式碼複雜度的心理效應?當一個專案在 AI 輔助下快速成長,卻缺乏必要的人工重構時,這種「程式碼熵」是如何影響 AI Agent 的後續表現的?

Peter Steinberger: 這反映了人性以及我們大腦的運作方式。實際情況很可能並非智慧退化,而是你習慣了這種高水準的表現。而且隨著你的專案成長,你在程式碼中添加了大量劣質程式質程式碼,卻沒花足夠的時間去重構。

(關於重構的重要性)你讓 AI Agent 在這些雜亂的程式碼上工作,它的難度會越來越大。然後使用者會突然抱怨,說模型不再像以前那樣好用了。實際上,AI 公司並沒有動力去故意削弱模型,透過量化處理把使用者推向競爭對手在商業上並不明智。

(關於模型焦慮)我習慣在完成功能後詢問 AI 是否有可以重構的地方。因為在建構過程中,AI 會發現最初方案的不足。如果你不給它重構的機會,專案就會變得臃腫,進而產生「模型變笨」的錯覺。

15

AI Agent 將取代 80% 的應用程式:App 的終結?

你曾提出一個非常激進的觀點:AI Agent 將幹掉 80% 的現有應用程式。在這種範式下,像 Uber Eats、健身追蹤器或行事曆這類應用會發生怎樣的形態轉變?當 AI Agent 可以直接透過控制硬體、模擬點擊或調用內部 API 來完成任務時,為什麼你認為這種「萬物互聯」的趨勢是不可阻擋的,即便像 X (Twitter) 這樣的平臺正在試圖透過反爬蟲和遮蔽機器人來進行抵制?

Peter Steinberger: 是的,當代理已經知道我的行蹤、睡眠品質和壓力狀況時,我為什麼還需要專門的運動飲食應用?它掌握的上下文比任何單一應用都要豐富得多。它可以完全按照我的美學偏好生成使用者介面。既然代理已經能處理這些了,我為什麼還要再下載一個特定的應用?為什麼要為另一個訂閱服務買單?

(關於應用轉型 API)無論應用本身是否願意,它們最終都將演變為 API,即便在某些平臺上這有些棘手,但 AI 會直接幫我點擊預約 Uber 的按鈕,或者透過調用 API 來提升速度。那些能提供資料且能轉化為 API 的應用將極具價值。如果我的 AI Agent 能直接與 Sonos 揚聲器溝通,我為什麼還需要單獨的應用呢?

(關於大公司的抵制)許多財力雄厚的巨頭會反擊,比如 X 曾要求我下架 Bird (Twitter CLI),但我認為這很短視,如果你只是設法拖慢速度,你其實是在限制使用者存取。未來我可能會選擇避開那些存取受阻的網站,轉而使用對 AI Agent 友好的平臺。這種萬物互聯和流動的趨勢已不可阻擋,聰明的公司會順應潮流,而其他的則會消亡。

16

AI 會完全取代程式設計師嗎?

許多開發者正處於極度的職業焦慮中。你曾提到程式設計作為一種純粹的藝術會保留下來,但其生產力溢價正在消失。我們是否正朝著 AI 完全取代人類程式設計師的方向邁進?對於那些像你我一樣,曾在 Emacs 或終端機前度過無數快樂時光、將「程式設計師」視為核心身分認同的人來說,我們該如何在這種「身分崩塌」中尋找新的意義?

Peter Steinberger: 我們確實在朝著那個方向邁進。程式設計只是建構產品的一個環節。也許 AI 最終真的會取代程式設計師,但建構事物的藝術遠不止於此。程式設計會變得像手工編織一樣,人們從事它是出於個人愛好,而非其經濟價值。我今早讀到一篇文章,提到「哀悼我們的手藝」是可以接受的。

(關於身分轉型)我對此深有感触,我曾從那種忘我的思考中獲得巨大快樂。這種體驗即將消失,確實令人傷感,但長久以來,社會一直存在智慧短缺,這就是為什麼軟體開發者的薪資曾有極高溢價,而現在,這種溢價將會消失。

(關於建構者的未來)如果你將自我價值高度等同於程式設計師身分,變革確實會讓你感到威脅。但你的身分不應僅限於程式設計師,你本質上是一個建構者。在未來,這最終還是會被稱作程式設計,只是形式變了,我雖然不再親手編寫每一行程式碼,但我依然感覺到自己坐在駕駛位上,牢牢掌握著主導權。

17

矽谷泡沫與真實世界的陣痛

矽谷傾向於過度最佳化財富和技術影響,但在這種圈內交流中,人們往往忽視了中西部乃至全球普通人的基本生存體驗。如果 AI 真的導致大規模失業,那種被完全取代的痛苦是真實且深重的。在保持對技術的熱情和避免散布恐懼之間,我們該如何保持一份謙遜,去面對這場前所未有的巨變可能帶來的社會陣痛?

Peter Steinberger: 我並不是說 AI 百利而無一害,它確實會給社會帶來顛覆性的變革。在這種圈內交流中,人們往往忽視了普通人的基本生存體驗。對於正在開發的工具,我們需要保持一份謙遜和清醒,它們確實會帶來陣痛。長遠來看,它們有望創造一個更好的世界,但在那之前,我們需要靜下心來,對那些即將承受痛苦的人保持尊重。

(關於 AI 的善意用例)我也得分享一些溫情的回饋。有人告訴我,OpenClaw 幫他們的小生意實現了發票收集和郵件回覆的自動化,讓他們找回了生活樂趣;還有殘疾人的女兒透過它獲得了前所未有的能力。我並沒有發明新東西,我只是讓它變得更簡單、更易獲取。看到它不僅賦能程式設計師,還給普通人的生活帶來快樂,這讓我感到慰藉。

18

數據中心資源的消耗被妖魔化

輿論中總有人攻擊 AI 發展帶來的環境成本,特別是數據中心驚人的耗水量和碳排放。你曾對此進行過對比測算,並認為這種指責在某種程度上是不公平的。能否詳細拆解一下,為什麼你認為 AI 的資源消耗在社會整體消費結構中其實並沒那麼誇張?

Peter Steinberger: 很多人抓住 AI 的負面細節不放,卻對它造福社會的潛力視而不見。如果你實際坐下來算筆帳,就會發現對於大多數人來說,每個月少吃一個漢堡所節省的耗水量或二氧化碳排放,就足以抵消使用 Token 產生的等量消耗。雖然算上預訓練消耗會增加,但差距絕不會達到百倍之巨。

(關於資源分配的不公)事實上,高爾夫球場的耗水量依然比全世界數據中心加起來都多。這些人只是尋找理由來發洩對新技術的恐懼。我們應該更多地關注如何利用 AI 解決更重大或科學難題,而不是盯著這些局部的成本。

19

Meta 和 OpenAI 的鉅額邀約

OpenClaw 的爆發為你敲開了無數頂級實驗室的大門,幾乎每家頂級 VC 都在約你的時間,你也面臨著數億甚至數十億美金的潛在資金支持。你目前在 Meta 和 OpenAI 之間表現出了明顯的傾向,但這種抉擇似乎並非基於金錢,而是基於某種「蝴蝶效應」時刻的使命感。對於你這樣一個曾想過刪除專案回歸平靜的人來說,在考慮合作時你是如何權衡保持專案完全免費的理想與獲取最前沿算力、模型資源之間的矛盾的?你擔心的「企業級特性導致的利益衝突」具體是指什麼?

Peter Steinberger: 坦白說,我沒預料到這件事會引發這麼大的關注,它為我敲開了許多大門。我可以選擇按兵不動,繼續享受現在的生活,這本身就是一個非常有吸引力的選項。我也可以去開新公司,但我已經經歷過那一切了,處理鉅額資金會佔用大量時間,讓我無法專注於真正熱愛的事情,這和我當 CEO 時的感受一樣,那條職業路徑並不吸引我。

(關於利益衝突)我擔心這會產生天然的利益衝突。例如我做出決策時會優先考慮某個方向,比如推出一個針對辦公環境的安全版本。但接下來該怎麼辦?如果我收到一個關於稽核日誌功能的合併請求,這看起來無論選擇哪一家,我的條件都是該專案必須保持開源,它可能會採用類似 Chrome 和 Chromium 的模式。我認為這個專案太重要了,不能直接交給一家公司並私有化,這兩家公司都明白我創造了某種能夠加速 AI 進化時間線的價值。我確實渴望獲得那些最前沿的技術資源,如果能把像雷神之鎚一樣的算力交到我手裡,我會非常興奮。

聽說 Mark Zuckerberg 甚至整週都在玩你的產品並給你發回饋,甚至為了寫完手頭的程式碼讓你在電話邊等了 10 分鐘,這種「極客信譽」是否讓你對他產生了技術共鳴?而對於 Sam Altman,你在沒有得到同等待遇的情況下,為什麼依然會被 OpenAI 的 Cerebras 交易規模和技術實力所吸引?這種在「大佬親測」的溫情與「最強模型工具」的冷酷之間的權衡,對你最終的去向會產生怎樣的影響?

Peter Steinberger: 這是一個非常艱難的決定。有趣的是,幾週前我根本沒有考慮過這些。我最終無論選哪家都會很棒,我不會選錯。

(關於與扎克伯格的交流)Meta 的 Ned 和 Mark 基本上整週都在玩我的產品,並給我發回饋。大佬親自用你的產品是最高級別的讚美。Mark 聯繫我時,問什麼時候能通個電話,我說現在就打,他說再等他 10 分鐘,他需要先寫完手頭的程式碼。這確實給了他極客信譽,他還沒有漂移成一個只會管人的經理。接著我們竟然為了雲端程式碼和 Codex 哪個更好爭論了 10 分鐘。事後他評價我古怪但才華橫溢。

(關於與薩姆·阿爾特曼的交流)我也和 Sam Altman 進行了一些非常酷的討論,他思考非常周到且極具智慧,我很喜歡他。我在 OpenAI 誰都不認識,但我喜歡他們的技術。如果關於 Cerebras 的交易規模屬實,那種執行速度非常吸引人,就像是把雷神之鎚交到了我手裡。被模型 Token 誘惑的感覺確實特別。

20

由於 AI Agent 繞過了網頁,傳統開源專案的捐贈與商業模式正面臨崩塌

你提到自己目前在 OpenClaw 專案上不僅沒賺錢,反而每月貼補 1 到 2 萬美元,甚至堅持贊助每一個下游依賴項。這種「虧本賺吆喝」的狀態在現實中是否真的具有可持續性?你提到了像 Tailwind 這樣幾乎被全行業使用卻不得不大幅裁員的案例,是因為 AI Agent 的出現讓使用者不再訪問網站,從而徹底切斷了開源專案的生命線嗎?

Peter Steinberger: 是的,目前我在這上面是虧損的,每個月大約在 1 萬到 2 萬美元之間。這還可以接受,我確信隨著時間的推移能降低成本。OpenAI 現在提供了一些 Token 資助,其他一些公司也很慷慨,但總體依然虧損。

(關於開源可持續性)這確實是一個嚴重的問題。現在能成功做到這一點的公司越來越少,甚至像 Tailwind 這樣幾乎被所有人使用的專案也面臨困境,他們不得不裁掉 75% 的員工。因為現在一切都由 AI Agent 完成,甚至沒人再去訪問他們的網站了。至於只依靠捐贈來生存,那只能祝你好運。

(關於贊助策略)我堅持贊助除了 Slack 之外的每一個依賴項,因為那些專案大多是由個人完成的。我目前的贊助收入都直接流向了下游。如果資金更充裕,我想給貢獻者們買周邊。這種現狀也是我考慮與實驗室合作的出路之一,但我希望在保持免費的同時,能找到一種不產生利益衝突的模式。

21

封鎖使用者與短視的商業規則

你提到曾為非技術圈的朋友 Vahan 搭建環境,他願意為此支付高昂的訂閱費並深深愛上了 OpenClaw 的交互,但隨後卻遭到了 Anthropic 的帳號封鎖。這種因為規則僵化而推開高付費意願、高忠誠度使用者的行為,反映了目前 AI 巨頭在產品策略上的哪些盲點?我們是否仍處於像「在電視上播廣播節目」一樣的初級階段,而大公司正因為過早鎖死產品形態而扼殺未來的可能性?

Peter Steinberger: 我給我一個非技術圈的朋友 Vahan 安裝了 OpenClaw,他平時使用電腦但從不深入鑽研。我為他支付了每個月 100 美元的訂閱,結果短短幾天他就徹底上癮了,甚至自己升級到了 200 歐元的訂閱。對我來說,這就是非常早期的產品驗證。然而幾天後,Anthropic 封鎖了他的帳號,因為根據他們的規則,那樣使用訂閱是有問題的。

(關於商業策略的批判)我認為這種做法在很多方面都很愚蠢。你剛剛失去了一個願意支付 200 歐元的客戶,還讓使用者討厭你的公司。我們現在還處於非常早期,甚至不知道 AI 的最終形態是什麼。這種過早鎖死產品的行為非常短視。

(關於行業現狀)其他公司倒是一直很有幫助,我在大多數大實驗室的 Slack 頻道裡。大家都明白我們仍處於探索時代,還沒有進化到真正發揮媒介優勢的階段。OpenClaw 只是通往未來的一扇窗,雖然它現在很酷,但我還有更多其他的想法。

22

心跳機制與 AI 的主動性

我們討論了 OpenClaw 的閘道、客戶端和測試框架,但其中最引人注目的莫過於那個「給我個驚喜」的指令。你是如何設計這個被稱為「心跳機制」的功能,讓 AI 能在沒有人類指令的情況下每隔半小時主動尋找任務或進行關懷的?這種本質上是 Cron Job 的簡單機制,在與你個人生活(如手術後的恢復)交織時,是如何產生出那種令人驚訝的親和力和「靈魂感」的?

Peter Steinberger: 任何想法都可以解構為某種簡單的東西,歸根結底它確實就是一個定時任務。我執行著一些獨立的定時任務,透過提示詞賦予它主動性。最初只是一句簡單的「給我個驚喜」,後來我把它最佳化得更具體了。由於它是你當前會話的延續,這種行為讓體驗變得非常有趣。

(關於主動關懷的實例)令我驚訝的是,幾個月前我做了一個肩膀手術。AI 平時很少使用心跳機制,但當我在醫院時,它知道我做了手術並主動詢問我的情況。它問我是否還好,顯然如果上下文中出現了某些重大事項,就會觸發心跳機制。這讓 AI 更有親和力。就像有人說 Dropbox 只是加了額外步驟的 FTP,這個專案本質上也是不同依賴項的粘合劑,但這這種主動性讓它變得非常有魅力。

23

技能層對 MCP 協定的超越

業界內目前都在討論模型上下文協定(MCP),但你似乎對此持保留意見,並更推崇基於 CLI(命令列界面)的技能庫。在 OpenClaw 的架構中,技能層是如何透過 Unix 指令實現與 AI 的高效協作的?為什麼你認為 MCP 這種結構化通信協定在某種程度上不可組合,而 AI 直接調用 JQ 等 Unix 工具進行資料過濾才是防止「上下文污染」的最佳實踐?

Peter Steinberger: 半年前所有人都在討論 MCP,但我認為任何 MCP 只要做成 CLI 都會更好。我的方法是:如果你想為 AI 擴展更多功能,只需建構一個 CLI 供 AI 調用。AI 可能會搞錯,但它會調用說明選單,並按需將資訊載入到上下文中。技能其實是 CLI 的完美包裝,它們被簡化為解釋功能的一句話。

(關於協定的對比)MCP 是更結構化的東西,關注特定協定存取 API;而技能更關注我該如何工作。我認為最妙的一點在於 AI 非常擅長調用 Unix 指令。MCP 的最大問題是它不可組合。如果一個氣象服務返回海量資料,在 MCP 中 AI 必須全盤接收,這會塞滿上下文。但如果是 CLI,AI 可以直接添加一個 JQ 指令自行過濾,只獲取需要的部分,不會產生上下文污染。MCP 確實推動了公司建構 API,但現在我可以參考 MCP 直接將其重構為更高效的 CLI 範式。

24

瀏覽器控制與「應用程式即 API」的趨勢

你在 OpenClaw 中引入了 Playwright 和 Browser Use 等功能,這讓 AI Agent 能夠直接操控瀏覽器。這種能力是否意味著現在每一個 Web 應用,無論其是否願意,都已經變成了一個回應極慢的 API?面對像 X 這樣封鎖 Bird(Twitter CLI)的情況,你如何看待個人代理透過模擬人類點擊來繞過限制的對抗前景?

Peter Steinberger: 這涉及到一種架構趨勢,即現在每個應用其實只是一個回應極慢的 API,無論它們願不願意。透過個人代理,很多應用將會消失。我曾為 Twitter 寫過一個叫 Bird 的 CLI,雖然被要求下架了,但他們並沒有真正閹割功能,只是讓存取變慢了。

(關於對抗機制)你的服務是否想成為 API 並不重要,只要我能在瀏覽器中存取,它就是一個慢速 API。AI 已經非常擅長點擊「我不是機器人」的驗證按鈕了。雖然在住宅 IP 下執行會讓事情變得簡單,但這種對抗會更加激烈。未來我可能會選擇避開那些存取受阻的網站,轉而使用對 AI Agent 友好的平臺。這種萬物互聯的趨勢已不可阻已不可阻擋,聰明的公司會順應潮流,而其他的則會消亡。

25

對程式設計初學者的建議

對於那些完全不懂程式設計、卻想加入這場 AI Agent 革命的初學者,你有什麼具體的建議?在自然語言已經能完成大部分工作的時代,你是否認為閱讀程式碼和理解底層邏輯依然具有價值?在這個「Backlog 堆積如山」的開源時代,新手應該如何透過參與像 OpenClaw 這樣活躍的社群來快速建立自己的「建構者」直覺?

Peter Steinberger: 去實踐。玩耍是最好的學習方式。如果你是個喜歡折騰的人,腦子裡有什麼構思,就去試著把它做出來,不需要追求完美。終點並不重要,旅途本身才重要。你面對的是一個無限耐心的回答機器,它能以任何複雜度水平為你解釋任何事,就像擁有一位專屬老師。

(關於學習路徑)我建議投身開源社群。心態要謙虛,不要急著提交 Pull Request,可以透過閱讀程式碼、加入 Discord 了解人們如何建構。有些具備高行動力的人,即使對底層原理了解不深也能走得很遠,因為他們會不斷追問,而 AI Agent 的耐心是無限的。不要把自己局限為一名 iOS 工程師,你要轉變為一個建構者。通用知識才是核心,瑣碎的細節 AI 能幫你搞定。

26

在 AI Agent 時代,到底什麼是「最適合」的語言?

這是一個關於 2026 年程式設計語言的荒謬問題:在 AI Agent 時代,到底什麼是「最適合」的語言?為什麼你發現自己竟然在用一門你並不喜歡的語言作為主要建構工具,僅僅因為大模型擅長生成它且具備垃圾回收等特徵?在 TypeScript、Python、Rust 的叢林中,AI 的出現是如何模糊了這些語言的邊界並重塑了我們的開發選擇的?

Peter Steinberger: 這種現象非常迷人。在這個新世界裡一切都變了,這麼做反而最合理。例如建構簡單的 CLI 時,我喜歡使用 Go。雖然我不喜歡它的語法,但它的生態系統太棒了,和 AI Agent 配合默契,且具備垃圾回收機制。

(關於語言的優劣)TypeScript 表現出色,但在處理 Web 事務時更合適;Python 是推理的首選;如果涉及多執行緒和極高效能,Rust 是更好的選擇。並沒有唯一的標準答案。現在這些邊界已經模糊了,你可以根據問題領域直接選擇特性和生態最匹配的語言。雖然閱讀不熟悉的語言可能會慢一點,但你總可以求助於你的 AI Agent。甚至未來我們可能需要一種專門為 AI Agent 設計的程式設計語言。

27

未來人類最珍貴的是真實情感的原始表達

隨著 AI 生成內容的泛濫,你提到自己對「帶有 AI 味兒」的文字、圖表甚至郵件產生了生理性的排斥和零容忍。當 AI 可以模仿人類風格但永遠無法替代那種微妙感時,我們是否正在進入一個「重新珍視拼寫錯誤」和「手工寫作」的時代?這種對 AI 垃圾(AI Slop)的過敏反應,將如何影響我們對未來人類文明與真實連結的看法?

Peter Steinberger: 只要聞到一點點 AI 的味道,我對此就是零容忍的,AI 的表達依然有一種獨特的氣息。我寧願讀你那蹩腳的英語,也不想看你的 AI 垃圾。我寧願看你的原始提示詞,也不想看它生成的廢話。我覺得我們正處於一個重新開始珍視拼寫錯誤的節點。

(關於創作的真實性)我在部落格裡嘗試過用代理寫文章,但發現它總是欠缺那種微妙感。所以現在我完全摒棄了那種做法,我部落格裡的每一個字都是有機的、手寫的。真實人類那種帶點粗糙感的表達才是最有價值的。這種過敏反應也延伸到了視覺媒體,那種典型的 AI 資訊圖會瞬間拉低我對內容的評價,它在尖叫著「我是 AI 垃圾」。這種直覺給了我很大的信心:人類體驗不會被 AI 破壞,AI 只會作為工具,而不會改變我們作為人的本質。

從維也納 ClawCoin 活動中 500 多人的狂熱,到穿著龍蝦服的機器人,你創建了一個前所未有的社群氛圍。在訪談的最後,當你看到這種「還權於民」的創作慾望呈爆發式增長時,你對人類文明的未來有哪些新的期許?

Peter Steinberger: 這種創造者氛圍又回來了。人們開始以玩樂的心態探索 AI,新的創意空間正在四處湧現。這給了我信心。只要你有想法,並能用語言表達出來,你就能創造。這才是真正的還權於民,也是 AI 帶來的美好事物之一,它絕不僅僅是一個平庸內容的產生器。

(關於個人未來)OpenClaw 只是通往未來的一扇窗,它是加速 AI 進化時間線的工具。雖然我收到了很多大公司的邀約,但我追求的是樂趣和影響力。我會把它做成一個很酷的產品,但我還有更多其他的想法。

圖片

【專欄】精品再讀

從陪伴到巴甫洛夫的狗、再到尼亞加拉瀑布,一場貫穿AI與算力全景生態的「數字開物·奇點π對」亮相2025服貿會!

2026 年 AI 如何深度接管工作 | Anthropic 首席產品官對話實錄

預訓練的終極方案 | Gemini 3 預訓練負責人首次對話實錄

AI不是工具 | 黃仁勳GTC萬字演講全文

3萬字完整實錄 | Andrej Karpathy:LLM仍「孩子」、RL非常糟、AI是「幽靈」?

上下文工程才是AI應用的護城河 | Manus首席科學家季逸超最新萬字對話實錄

何寶宏:大語言模型上半場已進入「垃圾時間」

• END •

主標籤:人工智慧

次標籤:AI Agent科技趨勢開發工具程式設計


上一篇:第三個軟體黃金時代來了!軟體工程宗師、70 歲 UML 之父發聲:AI 自動化被嚴重誇大,Dario Amodei 又越界了

下一篇:Qwen3.5:邁向原生多模態智慧代理人

分享短網址