圖片來源:YouTube
重點摘要:
AI工具帶來的不只是效率提升,而是徹底重塑開發流程。傳統「AI輔助寫程式碼」的說法已顯落伍,現階段AI已能支援從設計、開發到部署的全端式自動化構建與交付流程。
多數開發者卡在「環境優化迷思」。一些人在接觸AI新技術後,反而投入大量時間在超級優化開發環境,但這些「高效外衣」往往只帶來錯覺,真正該優化的是程式碼基座,讓它更適合團隊協作、持續演進,甚至讓AI智能代理(Agent)能在此中發揮最佳效能。
「以玩樂之心迎接AI」是關鍵。若你手上有想做的小專案,何不直接動手試試?只要動手能力稍強,你就能快速在AI輔助下構建出從前遙不可及的複雜專案。
《Builder Unscripted》是OpenAI官方打造的硬核對談節目,聚焦頂尖開發者動手實作經驗及觀察。在2025年2月25日公開首集,OpenAI首席開發者體驗長Romain Huet與知名iOS開發者Peter Steinberger圍繞OpenClaw專案、AI工具運用、個人開發哲學展開深度對談。
社群爆發:從線上到全球線下的魔法時刻
Romain:歡迎Peter!這些年總在線上交流,能在舊金山見到你,真的很高興!
Peter:謝謝!也謝謝你們把辦公室布置得這麼舒適。
Romain:最近這幾週忙翻了!其實一個月前就想錄這集,可能還要特別介紹背景。但現在幾乎不用鋪墊——能讓一個開源專案登上《華爾街日報》,這成績確實值得慶賀。Peter,你此刻什麼感受?
Peter:一開始面對AI時,我只想激勵更多人參與。沒想到現在走到這一步,彷彿達成某種「終極形態」。背後理由很簡單:AI讓每個人都能構建任何東西。但這些改變來得太快,我也有點信息超載。
Romain:這段經歷確實精彩。上週我在舊金山參加了不少活動,包含Codex黑客松,同時主辦了一場圍繞OpenClaw的meetup。
Peter:這事本身就是社群推動的。有人提議辦線下見面,我們便在Discord上建頻道討論meetup計畫。沒想六週後,現場湧進將近一千人!現場氣氛、色彩、五花八門的創意專案——真的能感受到那股熱情與創造力的能量!
Romain:那一刻我才意識到:我們真的「做對了」——這個專案彷彿擁有某種魔力,短短幾週就吸引成千上萬人使用、支持,甚至專程從各地趕赴舊金山參加meetup。
Peter:更誇張的是,下周在歐洲的維也納都已湧入超過300人預約參加。無論舊金山那樣成熟的科技圈,還是歐洲二線城市,這種熱度著實驚人!
Romain:對!它不只是單一城市現象,而是正席捲全球的契機。
Peter:沒錯!最棒的是它觸及不同國度、不同文化。
Romain:的確如此。這幾天與社群交流後,你最大的感觸是什麼?
Peter:我感觸很深。很多人愛上這專案,也有人期待立馬看到完美的「成品版」。對我來說,過去一年這專案更像我個人的實驗場——我不斷驚嘆AI展現的各種可能性。對開發者來說,我們確實生逢其時。
開發者的黃金時代:
AI重構「開發者」定義與工作流程
Romain:身為一位builder,此時最有趣的地方是什麼?整個工具鏈正在變動,對「開發者」這身份的定義也在重塑——幾乎任何人都能構建任何東西!
Peter:我剛接觸這項新技術時,每次都像坐雲霄飛車般的癲峰體驗!當時我用Claude Code試玩,只要模型做對一丁點事(成功率約30%-40%),對我來說已是徹底震撼——那些本不可能的事,現在竟然能做到!以前軟體開發總慢且複雜,程式本身也難以駕馭;但現在速度快太多了!
Romain:聽來真有趣!我回顧你PSPDFKit的傳奇:解決問題、打造解法、創業規模化、最終售出公司——這段旅程外界看來不可能那麼輕鬆。Peter你當初是如何開始的?
Peter:其實我並非某天突然想做PDF框架!這幾乎是我興趣清單中最末位。一切發生得自然而然,彷彿蝴蝶效應:Nokia工作經驗、友人需求、美國簽證延宕——這些偶然因素最終讓我下定決心創業。
Romain:有趣的是,公司建立後,你似乎休息了一陣子。是什麼驅動你重返這領域?
Peter:那時我真的筋疲力盡。連續創業13年、高強度運營公司真的折磨人,而創業打拚的壓力調適方法我也沒摸索到。某段時間近乎透支,需要好好放鬆一下。
縱使如此,我仍關注科技新聞。看到GPT Engineer(早期版本),覺得不錯但並不即刻興奮——只有親身體驗才能感受其力量。我那時心態是:若要重新開始創造東西,我不想再玩傳統科技領域,因我已做了太久,而世界似乎向前跨了一大步。許多東西需要被重新構建——而我恰好有回歸動力與契機。
但站在專家角度轉向另一領域,那種「難」根本不是難字可形容,更像是一種痛苦。儘管我對構建專案有豐富知識,若沒有AI Agent輔助,要將這能力遷移至新領域仍需花大量時間重新學習。當時我想:乾脆仔細瞧瞧這AI東西長什麼模樣!
真正讓我震撼的時刻是,我拿一個半完成的專案來嘗試——那也是我因筋疲力盡而擱置的計畫。我把一切整理成長達1.5MB的Markdown檔,把所有檔拖入Gemini Studio 2.5,讓它撰寫spec。之後再把生成結果整理回來,拖入Cloud Code,切換其他螢幕畫面——旁邊螢幕就這樣跑了幾小時!
那次很困難。當時模型告訴我「已100%可量產」,但試著跑後直接掛掉!於是我植入Playwright(這是少數真會用的MCP之一)——讓它自動構建登入流程,並沿途查核是否正確(例如測試Twitter)。一小時後,它真的成功了,還展示些成果!
Romain:很多人把OpenClaw稱為你的「一夜爆紅」。但我最著迷的是,它其實是你過去9-10個月數十個專案的積累。看你GitHub頁面——過去12個月你就貢獻超過40個專案!
Peter:其中約一半專案都被整合進OpenClaw。
Romain:能否聊聊這趟旅程?這些想法、實驗如何最終凝聚成OpenClaw?
Peter:坦白講,我並非一開始就有一套完整清晰的規劃!大多是探索性質。我當時只是想要些功能或工具——它們卻不存在,所以我們「創造」它們,用提示(prompt)讓它們出現。為何?只因我想這麼做。我希望讓我的Agent幫我些事情,但那時我尚未有完整願景。
有趣的是,它又回到原點。比如我希望它能查看我whatsapp(聊天紀錄),於是我就實作之,甚至註冊相關域名做原型。可當時心想:這些大公司或實驗室遲早會做。於是我停下腳步,試玩其他實驗。那半年更多是為好玩、為激勵他人。
到了去年11月,我陸陸續續做了幾版,但都不盡理想。那時我不禁想:幹嘛還沒人做這些?於是我拍拍屁股,自己動手做了第一個版本,也是OpenClaw正式Alpha版。儘管那時才第五版,我本人對它尚未完全動心。直到某個週末在馬拉喀什旅行時,我驚覺自己開始頻繁用它——原因無他,太方便了!當地網路不穩定,但whatsapp隨處可用!
我用它做了很多事:翻譯圖片、尋找餐廳、查閱電腦檔案。某次我把這些成果秀給友人看,他們都想要這功能。我頓時想:你們不該用它!反正你們還沒理解它的厲害之處!
Romain:這正是「產品與市場契合度」的唯一信號——連你的友人都想立馬用你的作品,這就代表它真的有價值!
之前這類工具大多是為技術同好保留的。
Peter:真正打動我是親身用它的過程。某次我嘗試傳送語音訊息,模型居然正常處理完回覆我!當下我嚇了一跳:它怎麼做到的?它本來不能播放語音檔!但它居然幫我辦到了!
其實它那時的處理流程是:
- 判斷我傳的「檔案」其實是無副檔名的檔案。
- 看檔頭辨識格式是語音編碼。
- 用ffmpeg在電腦上轉檔。
- 想把它轉寫成文字,但電腦上沒裝Whisper。
- 於是它自行搜尋,找到OpenAI的API金鑰(已整合在環境變數),用curl把檔寄給OpenAI語音轉錄服務,最後把語音成功轉寫成文字回覆我。
整個流程徹底顛覆我想像力!我在溝通時說這故事,有人驚呼「天啊!它居然動用我OpenAI金鑰!」但其實設計如此:那些API金鑰原本就是為這種自動化腳本而設!若這真是個會動用OpenAI金鑰的腳本,而你的bot就在同環境執行,自然能這麼用——這正是我想要的效果!
Romain:根本就是重新定義個人AI助理的能力邊界!
Peter:對!但它本質上就是為個人使用情境打造的工具,並非被設計來隨意丟進公共群組就能自動正常運作的。
震撼時刻:
AI Agent如何自主解決未曾預設的複雜問題?
Romain:能否詳細聊聊剛才語音處理的故事?前幾天我倆才談起它!
Peter:這真的莫名震撼!它讓我看見模型在解決問題的強大能力!我們打造這套工具確實為了AI代理工程師(agentic engineering),但核心技能更抽象:優秀程式設計師必先是優秀的問題解決家——而這能力可對應到任何領域!
不少人輕視「把AI當工具用」的概念。但真正用後,那種體驗差異完全天壤之別!
Romain:的確如此!把完整電腦存取權限交給AI Agent後,它居然能自行串接各資源、設計解決路徑——哪怕這情境此前沒編過任何一行!
Peter:我講這故事時,有人驚呼:「天啊!它居然動用我的金鑰!」可這正是它能正常運作的關鍵設計。我把OpenAI API金鑰放環境變數,原本就是為了這種自動化情境而生。
但之後我幾次把它秀給友人、小團隊成員測試時,它都完美處理——某種意義上,它只是為一對一溝通而打造的個人助理。
突破Agentic Trap:
保持簡單與專注才是王道
Romain:很多人想腰斬到你的效率水準——你的coding setup怎麼打造的?先前你也提過,很多人把環境弄得過度複雜。
Peter:其實我以前也這麼幹!我稱它為「Agent陷阱」(agentic trap)。在首次觸及新技術到真正高效之間,人們常卡在這:不斷「超級優化」自家環境!但那些優化往往只是製造「我變超強了!」的迷思錯覺——看似高能,產出卻未必提升!
我那時寫一篇廣為流傳的部落格文:要把它視為對話去面對它。模型更像與你交流——它不完全是傳統Pair Programming,而是另一種持續式對話。我大多數時間只是直接告訴它我想要什麼!
我總會先反問模型:「你有什麼問題嗎?」因它預設模式會直接嘗試解法,並自行做各假設。但那些預設假設未必是最適——它訓練資料裡包含大量過時程式碼,所以我會反問它以釐清需求,進而得到更好結果。
「你有什麼問題嗎?」其實是很關鍵的問題。模型每次對話都是乾淨 slate——它對程式碼庫一無所知!它只根據當前對話找尋相關碼片、解決你提出的單一問題。它通常看不到全貌。
要把事情做對,完整畫面要在自己腦海中成型,並引導模型去看這看那。Codex在這方面勝在能先做整體掃描再聚焦細部。我的方法其實很簡單:不用複雜的worktree、只用單一1-10分支checkout,將不同問題模組化。規模稍大後,這方法反而更省力——不同人能在不衝突模組同時完成,完全避開環境打架。
Romain:聽來,保持簡單能讓你專注真正核心問題!
Peter:沒錯!你若用最原始模式把專案clone下來、build、run,源碼就在本地磁碟上——如此AI Agent「坐」在源碼中對它有感知!若你不喜歡任何地方,直接丟prompt讓它修改,某種意義即是真正的「自我修改程式」。
Codex之所以強大在於它構建效度極高且能直接跑!人們沒意識到GPT-5.2帶來飛躍式突破——它們能直接把你prompt變現成能直接運作的成果!這感覺太神奇了!
Romain:太棒了!太不可思議了!
Peter:千萬要親自試試!
程式碼之外的價值觀:
重新定義開源貢獻的新型態
Romain:你在打造OpenClaw時投入大量Codex。除了它,這些工具是否也改變你的工作流程或思考方式?
Peter:大多數程式碼其實「無聊」,不過是把資料結構A轉成B、再呈現給用戶,或傳到下游系統。所以我通常只需快速掃過模型生成的碼——看它長相是否符合我心智模型(該長這樣),就八九不離十了。
但真正需要優化的是整個程式碼庫,讓它更適合團隊協作、持續演進——讓Agent在此中發揮最佳效能!而這未必等同於「人類寫來最舒服」方式。你可以用prompt引導模型往某風格調,但問題本身往往有多重結構化做法,大多數時候不存在唯一正解。若後續有效能瓶頸再針對調校即可。核心邏輯還是:讓系統先跑起來,之後再精雕細琢。
Romain:這觀點也改變我對開源的看法!像OpenCloud現在有兩千多個打開的PR!過去沒AI時,每個PR都需深度review——因程式碼本身就是核心價值。但現今PR更像「prompt request」而非單純的pull request!真正重要的常是PR背後想法、意圖與方向,而非特定實作程式碼。程式碼可由模型重寫、重構、甚至重新生成。
Peter:過往審核PR時,有些貢獻者提交的PR花的時間比我親自寫還多!我對模型的「善意」信任遠高於路人貢獻者——所以對這類PR必須更謹慎審查。當我審核PR時,我第一步會丟俯問題給模型:「你理解此PR意圖嗎?」因我真正關心不是程式碼本身,而是那人真正想解決什麼問題!很多時候PR更像一張issue配上一大包解法嘗試。首先,很多人仍不曉得如何真正釋放Agent能力。他們經常只丟局部解法,因他們腦中沒有全貌。難點在於這新功能如何嵌入到更大系統中?或這小修復——它真的是正確解嗎?問題會不會其實更偏向某模組,甚至是架構層級的問題?若只是與模型對話,它其實非常擅長處理這些狀況!
我有次這麼丟去反問:「這改動的意圖是什麼?真的是最適解?」,有時它會說是,更多時會說不是。之後我們才會一起探索什麼才是更合宜修復方式:這是架構層級問題?比如該訊息處理問題——是只影響whatsapp或也會影響Signal?那乾脆用更通用方式解?這算新功能嗎?我們真的需要它嗎?這些討論常要10-15分鐘!我大多用語音溝通,因它感覺就如同與一位超聰明同事在交流。
Romain:用語音token(語音輸入)可能比打字更輕鬆!
Peter:對!當我確認方向沒問題,就觸發指令(slash command)例如LPR,它會把整個流程講清楚:建立分支、完成所有修改、PR合併。即便此流程用時比自己從頭寫還長,我仍會保留原作者署名以珍惜大家參與其中的心意。
展望OpenClaw的未來:
成為個人AI Agent的典範與啟發
Romain:展望未來,有越來越多人加入OpenClaw專案之際,你認為它會走向何方?同時,你是否自許為某種「探路者」——為未來數十億人若使用個人AI Agent,提供某可參照的新典範?
Peter:沒錯!我希望在兩端取得平衡:一端讓媽媽這類非技術用戶也能順暢安裝;另端保有它的可玩性與可hack空間——這兩者天生矛盾,卻也必要!多數開源下載直接install package,但我長期習慣git clone、build、run——如此原始碼就直在本地磁碟、Agent可感知這份source code!
你若不喜歡任何地方,直接丟prompt讓它改——某種意義即是真正的「自我修改程式」。也因此,很多原先沒聯繫過我的人現在都開始提交PR!這也是為何我更願意稱它為「prompt request」——重點不只是程式碼本身,而是對「如何構建一個可持續演進軟體」的理解與典範。
講回開源場景:有人把它丟到開放網路,儘管我在文件再三強調「千萬別這麼幹,這不是設計初衷!」但安全圈仍有人把它打成CVSS 10級問題。因它原生只為本地受信任網路設計,後續加入安全專家把安全列為核心關注,變得更重要。重點是支持更多不同使用情境後,盡量避免讓用戶「誤傷自己」。
Romain:這正是開源魔力!人們能以意想不到的方式擁抱它。
Peter:對!這既是魅力也是瘋狂之處。
Romain:閒聊一下Codex Hackathon!這周我和幾位開發者聊到你即將參加,他們都很好奇:Peter腦袋到底怎麼長的?想法從哪來?是否有某套清晰哲學?
Peter:更像是意識到:現在很多事情變簡單了!就算開源專案已能解我70%問題,我也寧願親自動手——一年前根本不可能!現況是:丟屬於Codex的prompt,在第二塊螢幕跑——它就開始工作了!
Romain:我倆都來自歐洲,當我離開舊金山回歐洲後,相信你也有感:許多工程師尚未真正開始使用Codex或Agent工具。
對於他們,你有何建議?是否應在入門時重新思考工作方式與流程?
Peter:我的起手建議永遠是:以玩樂之心迎接它!只要你有動手能力,就盡情構建你心心念念的專案!腦海中若總有想做的專案,就盡情去玩它!必須以一種玩樂、甚至調皮的心態去面對它。
我記得Nvidia執行長黃仁勳也講過:「短期內,你不會被AI取代,但你會被『善用AI的人』取代!」
Romain:是比你更會用AI的人。
Peter:若你自詡為創造者、問題解決者——若你夠自主且夠聰明,你的需求量將比以往任何時刻都高。那靠的不是公司職位或履歷光環,而是你真正能解決什麼具體問題。
Romain:現正是創作者擁抱這些工具、引導好奇心的最佳時刻!也是真正將任何瘋狂想像化為實際行動的時刻——就像你透過這些專案及OpenClaw做到的一樣。
Peter:我直覺這一年內將徹底爆發!
Romain:沒錯!2026年真的很有趣!這結局太棒了!謝謝你抽空接受我們專訪Peter!在舊金山共度時光太棒了!我們整個OpenAI團隊都愛你的作品,也很樂意支持你這類開發者——坦白說,你直接啟發了整個開發者社群!再次感謝!我們都迫不及待想看你下一步行動!
原影片:Builders Unscripted: Ep. 1 - Peter Steinberger, Creator of OpenClaw
圖文編輯整理:Z Potentials編輯部
若你對此文有任何想法或見解,歡迎在Z Potentials官網的留言區交流討論。
Z Potentials持續推出更多關於AI、機器人、全球化等領域的優質內容。誠摯邀請對未來充滿期待的你加入我們的社群,與我們一同分享、學習、成長!