深度專訪丨OpenAI對談OpenClaw：AI正重新定義開發者，以「玩樂」心態面對AI

AI重新定義開發者的概念圖 OpenClaw專案代表圖

圖片來源：YouTube

重點摘要：

AI工具帶來的不只是效率提升，而是徹底重塑開發流程。傳統「AI輔助寫程式碼」的說法已顯落伍，現階段AI已能支援從設計、開發到部署的全端式自動化構建與交付流程。
多數開發者卡在「環境優化迷思」。一些人在接觸AI新技術後，反而投入大量時間在超級優化開發環境，但這些「高效外衣」往往只帶來錯覺，真正該優化的是程式碼基座，讓它更適合團隊協作、持續演進，甚至讓AI智能代理（Agent）能在此中發揮最佳效能。
「以玩樂之心迎接AI」是關鍵。若你手上有想做的小專案，何不直接動手試試？只要動手能力稍強，你就能快速在AI輔助下構建出從前遙不可及的複雜專案。

《Builder Unscripted》是OpenAI官方打造的硬核對談節目，聚焦頂尖開發者動手實作經驗及觀察。在2025年2月25日公開首集，OpenAI首席開發者體驗長Romain Huet與知名iOS開發者Peter Steinberger圍繞OpenClaw專案、AI工具運用、個人開發哲學展開深度對談。

社群爆發：從線上到全球線下的魔法時刻

Romain：歡迎Peter！這些年總在線上交流，能在舊金山見到你，真的很高興！

Peter：謝謝！也謝謝你們把辦公室布置得這麼舒適。

Romain：最近這幾週忙翻了！其實一個月前就想錄這集，可能還要特別介紹背景。但現在幾乎不用鋪墊——能讓一個開源專案登上《華爾街日報》，這成績確實值得慶賀。Peter，你此刻什麼感受？

Peter：一開始面對AI時，我只想激勵更多人參與。沒想到現在走到這一步，彷彿達成某種「終極形態」。背後理由很簡單：AI讓每個人都能構建任何東西。但這些改變來得太快，我也有點信息超載。

Romain：這段經歷確實精彩。上週我在舊金山參加了不少活動，包含Codex黑客松，同時主辦了一場圍繞OpenClaw的meetup。

Peter：這事本身就是社群推動的。有人提議辦線下見面，我們便在Discord上建頻道討論meetup計畫。沒想六週後，現場湧進將近一千人！現場氣氛、色彩、五花八門的創意專案——真的能感受到那股熱情與創造力的能量！

Romain：那一刻我才意識到：我們真的「做對了」——這個專案彷彿擁有某種魔力，短短幾週就吸引成千上萬人使用、支持，甚至專程從各地趕赴舊金山參加meetup。

Peter：更誇張的是，下周在歐洲的維也納都已湧入超過300人預約參加。無論舊金山那樣成熟的科技圈，還是歐洲二線城市，這種熱度著實驚人！

Romain：對！它不只是單一城市現象，而是正席捲全球的契機。

Peter：沒錯！最棒的是它觸及不同國度、不同文化。

Romain：的確如此。這幾天與社群交流後，你最大的感觸是什麼？

Peter：我感觸很深。很多人愛上這專案，也有人期待立馬看到完美的「成品版」。對我來說，過去一年這專案更像我個人的實驗場——我不斷驚嘆AI展現的各種可能性。對開發者來說，我們確實生逢其時。

開發者的黃金時代：

AI重構「開發者」定義與工作流程

Romain：身為一位builder，此時最有趣的地方是什麼？整個工具鏈正在變動，對「開發者」這身份的定義也在重塑——幾乎任何人都能構建任何東西！

Peter：我剛接觸這項新技術時，每次都像坐雲霄飛車般的癲峰體驗！當時我用Claude Code試玩，只要模型做對一丁點事（成功率約30%-40%），對我來說已是徹底震撼——那些本不可能的事，現在竟然能做到！以前軟體開發總慢且複雜，程式本身也難以駕馭；但現在速度快太多了！

Romain：聽來真有趣！我回顧你PSPDFKit的傳奇：解決問題、打造解法、創業規模化、最終售出公司——這段旅程外界看來不可能那麼輕鬆。Peter你當初是如何開始的？

Peter：其實我並非某天突然想做PDF框架！這幾乎是我興趣清單中最末位。一切發生得自然而然，彷彿蝴蝶效應：Nokia工作經驗、友人需求、美國簽證延宕——這些偶然因素最終讓我下定決心創業。

Romain：有趣的是，公司建立後，你似乎休息了一陣子。是什麼驅動你重返這領域？

Peter：那時我真的筋疲力盡。連續創業13年、高強度運營公司真的折磨人，而創業打拚的壓力調適方法我也沒摸索到。某段時間近乎透支，需要好好放鬆一下。

縱使如此，我仍關注科技新聞。看到GPT Engineer（早期版本），覺得不錯但並不即刻興奮——只有親身體驗才能感受其力量。我那時心態是：若要重新開始創造東西，我不想再玩傳統科技領域，因我已做了太久，而世界似乎向前跨了一大步。許多東西需要被重新構建——而我恰好有回歸動力與契機。

但站在專家角度轉向另一領域，那種「難」根本不是難字可形容，更像是一種痛苦。儘管我對構建專案有豐富知識，若沒有AI Agent輔助，要將這能力遷移至新領域仍需花大量時間重新學習。當時我想：乾脆仔細瞧瞧這AI東西長什麼模樣！

真正讓我震撼的時刻是，我拿一個半完成的專案來嘗試——那也是我因筋疲力盡而擱置的計畫。我把一切整理成長達1.5MB的Markdown檔，把所有檔拖入Gemini Studio 2.5，讓它撰寫spec。之後再把生成結果整理回來，拖入Cloud Code，切換其他螢幕畫面——旁邊螢幕就這樣跑了幾小時！

那次很困難。當時模型告訴我「已100%可量產」，但試著跑後直接掛掉！於是我植入Playwright（這是少數真會用的MCP之一）——讓它自動構建登入流程，並沿途查核是否正確（例如測試Twitter）。一小時後，它真的成功了，還展示些成果！

Romain：很多人把OpenClaw稱為你的「一夜爆紅」。但我最著迷的是，它其實是你過去9-10個月數十個專案的積累。看你GitHub頁面——過去12個月你就貢獻超過40個專案！

Peter：其中約一半專案都被整合進OpenClaw。

Romain：能否聊聊這趟旅程？這些想法、實驗如何最終凝聚成OpenClaw？

Peter：坦白講，我並非一開始就有一套完整清晰的規劃！大多是探索性質。我當時只是想要些功能或工具——它們卻不存在，所以我們「創造」它們，用提示(prompt)讓它們出現。為何？只因我想這麼做。我希望讓我的Agent幫我些事情，但那時我尚未有完整願景。

有趣的是，它又回到原點。比如我希望它能查看我whatsapp（聊天紀錄），於是我就實作之，甚至註冊相關域名做原型。可當時心想：這些大公司或實驗室遲早會做。於是我停下腳步，試玩其他實驗。那半年更多是為好玩、為激勵他人。

到了去年11月，我陸陸續續做了幾版，但都不盡理想。那時我不禁想：幹嘛還沒人做這些？於是我拍拍屁股，自己動手做了第一個版本，也是OpenClaw正式Alpha版。儘管那時才第五版，我本人對它尚未完全動心。直到某個週末在馬拉喀什旅行時，我驚覺自己開始頻繁用它——原因無他，太方便了！當地網路不穩定，但whatsapp隨處可用！

我用它做了很多事：翻譯圖片、尋找餐廳、查閱電腦檔案。某次我把這些成果秀給友人看，他們都想要這功能。我頓時想：你們不該用它！反正你們還沒理解它的厲害之處！

Romain：這正是「產品與市場契合度」的唯一信號——連你的友人都想立馬用你的作品，這就代表它真的有價值！

之前這類工具大多是為技術同好保留的。

Peter：真正打動我是親身用它的過程。某次我嘗試傳送語音訊息，模型居然正常處理完回覆我！當下我嚇了一跳：它怎麼做到的？它本來不能播放語音檔！但它居然幫我辦到了！

其實它那時的處理流程是：

判斷我傳的「檔案」其實是無副檔名的檔案。
看檔頭辨識格式是語音編碼。
用ffmpeg在電腦上轉檔。
想把它轉寫成文字，但電腦上沒裝Whisper。
於是它自行搜尋，找到OpenAI的API金鑰（已整合在環境變數），用curl把檔寄給OpenAI語音轉錄服務，最後把語音成功轉寫成文字回覆我。

整個流程徹底顛覆我想像力！我在溝通時說這故事，有人驚呼「天啊！它居然動用我OpenAI金鑰！」但其實設計如此：那些API金鑰原本就是為這種自動化腳本而設！若這真是個會動用OpenAI金鑰的腳本，而你的bot就在同環境執行，自然能這麼用——這正是我想要的效果！

Romain：根本就是重新定義個人AI助理的能力邊界！

Peter：對！但它本質上就是為個人使用情境打造的工具，並非被設計來隨意丟進公共群組就能自動正常運作的。

震撼時刻：

AI Agent如何自主解決未曾預設的複雜問題？

Romain：能否詳細聊聊剛才語音處理的故事？前幾天我倆才談起它！

Peter：這真的莫名震撼！它讓我看見模型在解決問題的強大能力！我們打造這套工具確實為了AI代理工程師(agentic engineering)，但核心技能更抽象：優秀程式設計師必先是優秀的問題解決家——而這能力可對應到任何領域！

不少人輕視「把AI當工具用」的概念。但真正用後，那種體驗差異完全天壤之別！

Romain：的確如此！把完整電腦存取權限交給AI Agent後，它居然能自行串接各資源、設計解決路徑——哪怕這情境此前沒編過任何一行！

Peter：我講這故事時，有人驚呼：「天啊！它居然動用我的金鑰！」可這正是它能正常運作的關鍵設計。我把OpenAI API金鑰放環境變數，原本就是為了這種自動化情境而生。

但之後我幾次把它秀給友人、小團隊成員測試時，它都完美處理——某種意義上，它只是為一對一溝通而打造的個人助理。

突破Agentic Trap：

保持簡單與專注才是王道

Romain：很多人想腰斬到你的效率水準——你的coding setup怎麼打造的？先前你也提過，很多人把環境弄得過度複雜。

Peter：其實我以前也這麼幹！我稱它為「Agent陷阱」(agentic trap)。在首次觸及新技術到真正高效之間，人們常卡在這：不斷「超級優化」自家環境！但那些優化往往只是製造「我變超強了！」的迷思錯覺——看似高能，產出卻未必提升！

我那時寫一篇廣為流傳的部落格文：要把它視為對話去面對它。模型更像與你交流——它不完全是傳統Pair Programming，而是另一種持續式對話。我大多數時間只是直接告訴它我想要什麼！

我總會先反問模型：「你有什麼問題嗎？」因它預設模式會直接嘗試解法，並自行做各假設。但那些預設假設未必是最適——它訓練資料裡包含大量過時程式碼，所以我會反問它以釐清需求，進而得到更好結果。

「你有什麼問題嗎？」其實是很關鍵的問題。模型每次對話都是乾淨 slate——它對程式碼庫一無所知！它只根據當前對話找尋相關碼片、解決你提出的單一問題。它通常看不到全貌。

要把事情做對，完整畫面要在自己腦海中成型，並引導模型去看這看那。Codex在這方面勝在能先做整體掃描再聚焦細部。我的方法其實很簡單：不用複雜的worktree、只用單一1-10分支checkout，將不同問題模組化。規模稍大後，這方法反而更省力——不同人能在不衝突模組同時完成，完全避開環境打架。

Romain：聽來，保持簡單能讓你專注真正核心問題！

Peter：沒錯！你若用最原始模式把專案clone下來、build、run，源碼就在本地磁碟上——如此AI Agent「坐」在源碼中對它有感知！若你不喜歡任何地方，直接丟prompt讓它修改，某種意義即是真正的「自我修改程式」。

Codex之所以強大在於它構建效度極高且能直接跑！人們沒意識到GPT-5.2帶來飛躍式突破——它們能直接把你prompt變現成能直接運作的成果！這感覺太神奇了！

Romain：太棒了！太不可思議了！

Peter：千萬要親自試試！

程式碼之外的價值觀：

重新定義開源貢獻的新型態

Romain：你在打造OpenClaw時投入大量Codex。除了它，這些工具是否也改變你的工作流程或思考方式？

Peter：大多數程式碼其實「無聊」，不過是把資料結構A轉成B、再呈現給用戶，或傳到下游系統。所以我通常只需快速掃過模型生成的碼——看它長相是否符合我心智模型（該長這樣），就八九不離十了。

但真正需要優化的是整個程式碼庫，讓它更適合團隊協作、持續演進——讓Agent在此中發揮最佳效能！而這未必等同於「人類寫來最舒服」方式。你可以用prompt引導模型往某風格調，但問題本身往往有多重結構化做法，大多數時候不存在唯一正解。若後續有效能瓶頸再針對調校即可。核心邏輯還是：讓系統先跑起來，之後再精雕細琢。

Romain：這觀點也改變我對開源的看法！像OpenCloud現在有兩千多個打開的PR！過去沒AI時，每個PR都需深度review——因程式碼本身就是核心價值。但現今PR更像「prompt request」而非單純的pull request！真正重要的常是PR背後想法、意圖與方向，而非特定實作程式碼。程式碼可由模型重寫、重構、甚至重新生成。

Peter：過往審核PR時，有些貢獻者提交的PR花的時間比我親自寫還多！我對模型的「善意」信任遠高於路人貢獻者——所以對這類PR必須更謹慎審查。當我審核PR時，我第一步會丟俯問題給模型：「你理解此PR意圖嗎？」因我真正關心不是程式碼本身，而是那人真正想解決什麼問題！很多時候PR更像一張issue配上一大包解法嘗試。首先，很多人仍不曉得如何真正釋放Agent能力。他們經常只丟局部解法，因他們腦中沒有全貌。難點在於這新功能如何嵌入到更大系統中？或這小修復——它真的是正確解嗎？問題會不會其實更偏向某模組，甚至是架構層級的問題？若只是與模型對話，它其實非常擅長處理這些狀況！

我有次這麼丟去反問：「這改動的意圖是什麼？真的是最適解？」，有時它會說是，更多時會說不是。之後我們才會一起探索什麼才是更合宜修復方式：這是架構層級問題？比如該訊息處理問題——是只影響whatsapp或也會影響Signal？那乾脆用更通用方式解？這算新功能嗎？我們真的需要它嗎？這些討論常要10-15分鐘！我大多用語音溝通，因它感覺就如同與一位超聰明同事在交流。

Romain：用語音token（語音輸入）可能比打字更輕鬆！

Peter：對！當我確認方向沒問題，就觸發指令（slash command）例如LPR，它會把整個流程講清楚：建立分支、完成所有修改、PR合併。即便此流程用時比自己從頭寫還長，我仍會保留原作者署名以珍惜大家參與其中的心意。

展望OpenClaw的未來：

成為個人AI Agent的典範與啟發

Romain：展望未來，有越來越多人加入OpenClaw專案之際，你認為它會走向何方？同時，你是否自許為某種「探路者」——為未來數十億人若使用個人AI Agent，提供某可參照的新典範？

Peter：沒錯！我希望在兩端取得平衡：一端讓媽媽這類非技術用戶也能順暢安裝；另端保有它的可玩性與可hack空間——這兩者天生矛盾，卻也必要！多數開源下載直接install package，但我長期習慣git clone、build、run——如此原始碼就直在本地磁碟、Agent可感知這份source code！

你若不喜歡任何地方，直接丟prompt讓它改——某種意義即是真正的「自我修改程式」。也因此，很多原先沒聯繫過我的人現在都開始提交PR！這也是為何我更願意稱它為「prompt request」——重點不只是程式碼本身，而是對「如何構建一個可持續演進軟體」的理解與典範。

講回開源場景：有人把它丟到開放網路，儘管我在文件再三強調「千萬別這麼幹，這不是設計初衷！」但安全圈仍有人把它打成CVSS 10級問題。因它原生只為本地受信任網路設計，後續加入安全專家把安全列為核心關注，變得更重要。重點是支持更多不同使用情境後，盡量避免讓用戶「誤傷自己」。

Romain：這正是開源魔力！人們能以意想不到的方式擁抱它。

Peter：對！這既是魅力也是瘋狂之處。

Romain：閒聊一下Codex Hackathon！這周我和幾位開發者聊到你即將參加，他們都很好奇：Peter腦袋到底怎麼長的？想法從哪來？是否有某套清晰哲學？

Peter：更像是意識到：現在很多事情變簡單了！就算開源專案已能解我70%問題，我也寧願親自動手——一年前根本不可能！現況是：丟屬於Codex的prompt，在第二塊螢幕跑——它就開始工作了！

Romain：我倆都來自歐洲，當我離開舊金山回歐洲後，相信你也有感：許多工程師尚未真正開始使用Codex或Agent工具。

對於他們，你有何建議？是否應在入門時重新思考工作方式與流程？

Peter：我的起手建議永遠是：以玩樂之心迎接它！只要你有動手能力，就盡情構建你心心念念的專案！腦海中若總有想做的專案，就盡情去玩它！必須以一種玩樂、甚至調皮的心態去面對它。

我記得Nvidia執行長黃仁勳也講過：「短期內，你不會被AI取代，但你會被『善用AI的人』取代！」

Romain：是比你更會用AI的人。

Peter：若你自詡為創造者、問題解決者——若你夠自主且夠聰明，你的需求量將比以往任何時刻都高。那靠的不是公司職位或履歷光環，而是你真正能解決什麼具體問題。

Romain：現正是創作者擁抱這些工具、引導好奇心的最佳時刻！也是真正將任何瘋狂想像化為實際行動的時刻——就像你透過這些專案及OpenClaw做到的一樣。

Peter：我直覺這一年內將徹底爆發！

Romain：沒錯！2026年真的很有趣！這結局太棒了！謝謝你抽空接受我們專訪Peter！在舊金山共度時光太棒了！我們整個OpenAI團隊都愛你的作品，也很樂意支持你這類開發者——坦白說，你直接啟發了整個開發者社群！再次感謝！我們都迫不及待想看你下一步行動！

原影片：Builders Unscripted: Ep. 1 - Peter Steinberger, Creator of OpenClaw

圖文編輯整理：Z Potentials編輯部

若你對此文有任何想法或見解，歡迎在Z Potentials官網的留言區交流討論。

Z Potentials持續推出更多關於AI、機器人、全球化等領域的優質內容。誠摯邀請對未來充滿期待的你加入我們的社群，與我們一同分享、學習、成長！