上週連假期間,紅衫資本(Sequoia Capital)舉辦的 AI Ascent 2026 峰會上有兩場演講特別值得一看。一場是 Boris Cherny 的,他是 Claude Code 的創始人。另一場是 Andrej Karpathy 的。
兩個人從不同角度把同一件事講清楚了。程式設計的執行層已經被解決了。但方向層,反而變得更難了。
討論熱度非常高,收假趕緊來補課!
Claude Code 之父 Boris,現在工作方式完全變了
Boris 說,2026 年已經過了 5 個月,他今年壓根沒親手寫過一行程式。
而且,他現在幾乎不會坐在電腦前面。日常操作都在手機上的 Claude App 裡完成。畫面左邊有個 Code 分頁,同時跑 5 到 10 個對話,每個對話裡面一堆 Agent,平常幾百個在線,晚上可能多達幾千個。
他自己發明了一個工作流叫做 Sloop。原理很簡單,讓 Claude 用 Cron 來排程未來的任務,做成循環執行。每分鐘、每五分鐘、或每天跑一次。
他現在有幾十個循環在跑。一個盯著 Pull Request(PR),自動修 CI 或自動 Rebase。一個維護 CI 的健康狀態,測試偶爾掛了自己去修。一個每 30 分鐘抓一次 Twitter 上的使用者回饋,分類總結後傳給他。
他曾挑戰極限,一天處理了 150 個 PR。
他在 Anthropic 內部的職務狀態也變了,全公司已經沒有人在親手寫程式,所有 SQL、所有基礎架構,全部交給模型生成。他的 Claude 在背景循環執行時,會自動在 Slack 上跟同事的 Claude 溝通,互相解決問題。
人在睡覺,AI 在 Slack 上互相標註、互相對齊、互相偵錯。
這裡有個背景:Boris 表示在 Claude Code 剛開始內測的時候,自己只有 10% 的程式碼是用它寫的。但是,從去年五月 Opus 4 推出之後,Claude Code 的成長曲線開始起飛,從 4 到 4.5、4.6 到 4.7,每次模型更新,都在使用者成長上瘋狂體現。他坦承,Claude Code 可能是一次違背產品市場適配(PMF)的賭注,但這也算是一個新的模式:為還不存在的模型提前建好比拚場域(harness)。
對他個人而言,寫程式的時代已經結束了。
Karpathy:Software 3.0
Karpathy 的切入點很有意思。
他提到自己之前做了一個叫做 Menu Gen 的專案。
功能很簡單,拍張菜單照片,AI 幫你生成每道菜大概長什麼樣子。他用 vibe coding 方式搭了一個完整應用程式,部署到 Vercel,用 OCR 辨識菜名,再呼叫圖像生成模型。
但是沒多久他發現,有人做了一個更直覺的版本。把照片丟給 Google Gemini,讓 Nanobanana 在像素層面直接把菜品圖渲染到原始菜單上。輸入一張圖,輸出一張圖,中間不需要任何傳統應用程式邏輯。
Karpathy 看完意識到,自己做的整個 Menu Gen 其實已經過時了。那個 App 理論上不該存在。
他把這個現象拉到一個更大的框架來看。大型語言模型(LLM)就是一種新的電腦。傳統程式碼是 Software 1.0,訓練神經網路得到的權重是 Software 2.0,Prompting 是 Software 3.0。你往上下文視窗裡塞什麼,就等於你在寫程式。
另一個很具體的例子是 OpenClaw 的安裝方式。以前的工具安裝,可能是 shell 腳本,但 OpenClaw 是一段文字說明。把文件丟給你的 Agent,Agent 自己讀環境,自己判斷,自己在迴圈裡偵錯,最後就自己裝好了。
現在我們要思考的是該給 agent 哪一段文字。
大家不要只關注「程式寫得更快了」。更關鍵的變化是,更廣義的資訊處理正在變得可以自動化。以前程式碼處理的是結構化資料,但現在你可以把一批文件丟進去,讓模型重新編譯這些資訊,產出全新的知識結構。這些是以前根本不可能做的事。
鋸齒狀智慧
模型的能力非常不均勻,像鋸齒一樣。在程式碼、數學這些高度可驗證的領域,幾乎比所有人類都厲害。但是一旦脫離這個範圍,就可能看起來很蠢。
原因有兩層。一是訓練方法,最先進的大模型是用強化學習(RL)調出來的,答案對了就加分,程式碼恰好是最容易驗證對不對的東西。二是實驗室自己關注什麼,哪些任務經濟價值高就往資料分布裡猛塞,程式碼是最典型的例子。
Karpathy 還舉了一個說明問題的細節。從 GPT-3.5 到 GPT-4,模型下國際象棋突然變強,當時很多人以為是智慧整體提升的副作用。但更可能的原因是預訓練資料裡被額外加了大量棋譜。實驗室決定放什麼進去,你就得到什麼樣的能力分布。
Karpathy 說模型不是動物,是幽靈。動物有內在動機、好奇心、自我驅動。模型只是由資料和獎勵函數塑形出來的鋸齒狀實體。你對它發火不會讓它更努力,鼓勵它也不會讓它更有鬥志。它就是統計模擬電路。
而只有理解了這一點,用起來才會更準。
人在這個體系裡做什麼
Boris 說,他的角色變成了調度。他關心的是迴圈怎麼跑起來,Agent 之間的依賴怎麼自動解決,CI 怎麼自己維護。執行全部交出去了。
Karpathy 說,人必須負責規格定義(specification),必須負責規劃(plan)。他說自己其實不太喜歡那些所謂的 plan mode。因為他覺得更關鍵的是你得和 agent 一起把一份非常細的規格書設計出來,然後讓 agent 填入實作。人負責大框架和約束條件,agent 負責填空。
他給了一個很具體的例子。Menu Gen 裡,agent 用 Stripe 支付信箱去比對 Google 登入信箱來分配點數額度。但一個人完全可能兩邊用不同信箱。這種「信箱不是使用者 ID」的設計判斷,agent 做不來。
但是具體的執行細節可以交出去了。比如 PyTorch 裡面是 keepdims 還是 keepdim,是 dim 還是 axis,這些不需要記了。
但人對底層原理的理解不能丟,tensor 的 storage 和 view 是怎麼回事,什麼時候在無意義地複製記憶體,這些得自己知道。
Karpathy 還引用了一句讓他每隔兩天就想起一次的話,你可以外包思考,但你不能外包理解。
面試、護城河、創業機會
兩人都提到了面試方式要改變。
如果還在讓應徵者刷演算法題、解謎題,篩選的是上一代工程能力。Karpathy 給了一個具體的例子,比如讓應徵者做一個 Twitter 複製版,功能完整、安全性高,然後用十個 Codex 或 Claude 實例去攻擊他部署的網站,看能不能打穿。誰在這種環境下撐住了,誰才是這個時代的工程師。
Boris 從團隊角度說了一個已經在發生的變化。Claude Code 團隊裡,工程經理、產品經理、設計師、資料科學家、財務、使用者研究員,所有人都在寫程式。不是因為他們都是程式設計師,是因為寫程式已經不再需要專業程式設計師了。
當寫程式成本降了 100 倍,轉換成本在 AI 面前不堪一擊,模型可以輕鬆把資料從一個平台遷到另一個。流程效能在貶值,模型擅長理順工作流。但網路效應、規模經濟、壟斷資源依然有效。他的判斷,未來 10 年能顛覆現有市場的新創公司會增加 10 倍。
Karpathy 給創業者的建議更具體。別追大模型的逃逸速度,去造你自己的 RL 環境。可驗證性決定了哪些領域會被率先攻破,很多價值極高的 RL 環境還沒被開發出來。如果你能在某個垂直領域建構出夠好的強化學習環境和資料集,就能吃到巨大的槓桿紅利。
但是他說這話時笑了一下,「我不方便把答案直接笑了一下,「我不方便把答案直接講透。」
寫在最後
Boris 引用了一段歷史。1400 年代的歐洲只有 10% 的人識字。印刷機發明後 50 年,出版的文獻超過之前一千年的總和。書的成本降了 100 倍。最終全球識字率升到 70%。但作家這個職業依然存在。
程式設計正在經歷同樣的事。未來每個人都會寫程式,就像現在每個人都能讀寫。但這不是說工程師消失了。是說這個角色的核心能力從「寫程式」變成了「知道該讓 AI 寫什麼、以及什麼條件絕對不能省」。
執行層的天花板已經被模型捅穿了。但是又因為模型的鋸齒狀智慧。人在很多地方還不能鬆手。
這就是 2026 年程式設計這件事的完整地圖。
執行交給模型。方向留給人。
Boris 原始影片:https://www.youtube.com/watch?v=SlGRN8jh2RI
Karpathy 原始影片:https://www.youtube.com/watch?v=96jN2OCOfLs