Codex負責人自曝OpenAI內部開發：每週都在重塑！Codex已經化成隊友，可通宵運行、自我測試！新人建議：基礎永不過時；Win版本將上線

編輯｜雲昭

「未來某個時間點，也許我們會為Agent建構軟體。那時候，Agent可能會成為產品經理或產品工程師。」

昨天，OpenAI Codex 工程主管 Tibo Sottiaux 和 OpenAI 應用首席技術官 Vijaye Raji 做客 Pragmatic Summit，對外分享了 OpenAI 內部工程師的真實體感和感受。

回顧過去的 2025年， Tibo 表示變化程度可以用「震撼」來形容。

哪怕只看最近六個月，我們已經從「把 Codex 當工具」，到「把它當擴充」，再到「把它當Agent」，現在已經進化到「把它當隊友」。
有工程師甚至一週能消耗上千億的token，來跑多個Agent。

伴隨著Codex越來越強的能力，軟體開發這件事的瓶頸，甚至以週為單位發生變化：

以前瓶頸是程式碼生成，後來變成程式碼評審，現在更多是：怎麼更快理解使用者需求？怎麼處理 issue ？怎麼追蹤 Twitter 、 Reddit 等重要平台上的回饋，並把這些資訊綜合成產品策略？

甚至Tibo還爆料說：OpenAI內部一些工程師每週消耗的 token 數量達到數千億級別。而且這還不是單個 Agent 。

而且內部還有相較於外界更「科幻」的開發工具：Codex Box。

上週我們內部發布了 Codex Box，可以在伺服器上預留開發環境，直接發 prompt 讓它去幹活。你在筆記型電腦上編排流程，它在雲端執行任務。很多人關上電腦去開會，回來時工作已經完成。

再比如，Codex 團隊開會討論 Codex 時，會直接在會議室裡發起 Codex 執行緒來診斷問題和複盤分析。

提及未來，軟體開發這個行業會怎麼變化。Tibo 和 Raji 給出了幾個方向。

首先，開發的速度可能還會再提升一個數量級，這又會帶來新一輪改變。

其次，OpenAI 會真正跑通大規模的多智慧型體協作網路，讓它們圍繞非常宏大的目標協同工作。

第三，接下來，會為上面建構出來的系統建構護欄，開發者不必再逐行查看程式碼，而是透過某種方式驗證它的正確性，或者透過約束確保它的安全性。而程式碼本身則會被抽象掉，真正的焦點轉向問題本身，以及系統應具備的性質。

第四，Raji 提到，也許就在今年，開發者會擁有一個幫助自己檢查一兩百個小型Agent狀態的專屬的「個人代表型助手」，它能夠彙總代表所有在後台為你高效工作的 AI 智慧型體。你不必再去監控、逐個查看。（ps：有點像昨天小編報道的前Github CEO下場做的 Entire！）

另外，主持人還爆料到，OpenAI 傾向於招募產品型工程師。Raji 解釋道，產品直覺依舊很重要，畢竟本質上，產品還是為人建構的。

對於在AI時代想從事軟體行業的新人而言，Tibo 和 Raji 都表示：基礎能力永遠不會過時！OpenAI不會閉著眼睛完全依賴 Codex 。

只要你有扎實的基礎，有產品直覺，知道自己在建構什麼，能夠在技術堆疊上下游自由穿梭去解決問題，這些能力才是關鍵。而且這永遠不會過時。

「我們能坐在這裡，是因為我們有扎實的基礎。但軟體工程師的角色，確實已經發生了很大的變化！」

最後，多說一嘴，幾個小時前，Tibo 還宣布重磅消息：Codex 已經開始邀測 Window版本。

毫無疑問，這意味著 OpenAI 在企業端開發者繼續加碼了。

以下是小編為大家梳理的Codex團隊版本的「程式設計師進化故事」。

OpenAI內部開發發生了什麼：

Codex已進化成隊友

一些工程師每週消耗token數量高達千億級別

主持人：有個很多人都在問的問題： OpenAI 現在內部到底發生了什麼？更具體一點，從軟體開發的角度來看，工程師的工作方式到底怎麼變了？

Raji：你問得好，確實發生了很多變化。我在 OpenAI 大概六個月了，其中一個最深的感受是，公司內部的研究能力實在太強了。你只要往未來稍微投射一下那些可能性，就會覺得震撼。

先說軟體開發方式。 Codex 徹底改變了我們寫程式碼的方式。變化非常劇烈。哪怕只看最近六個月，我們已經從「把 Codex 當工具」，到「把它當擴充」，再到「把它當 Agent 」，現在已經進化到「把它當隊友」。我甚至覺得，工程師很快就會給自己的 Agent 起名字，把它當成真正的搭檔。這種變化發生得非常快。

我看過內部的排行榜，有些工程師每週消耗的 token 數量達到數千億級別。而且這還不是單個 Agent 。上週我們內部發布了 Codex Box，可以在伺服器上預留開發環境，直接發 prompt 讓它去幹活。你在筆記型電腦上編排流程，它在雲端執行任務。很多人關上電腦去開會，回來時工作已經完成。

這就是現在 OpenAI 內部的軟體開發方式。它已經發生了根本性的改變。我相信幾個月內，矽谷中心地帶會率先普及，然後擴散開來。以後大家都會這麼開發軟體。

主持人：如果我回到六個月甚至一年前，聽你這麼說，我可能會覺得你在講童話故事。但現在不一樣了，很多人都在用。我自己也在用。我也跟 OpenAI 的工程師聊過。我很喜歡跟工程師聊，因為他們幾乎沒有「媒體訓練」，說話很直接。

讓我有點安心的是，並不是所有工程師都 100% 用 Codex 寫程式碼。大家用得很多，但層級不同。有一個團隊確實走在前沿，那就是 Codex 團隊。

Tibo ，你帶 Codex 團隊。能不能講講你們現在每天怎麼工作？工程師的典型工作流是什麼樣？

Codex 團隊的工作方式每週都在快速變化

Tibo：情況變化非常快。 Codex 團隊有個很有意思的特點：我們幾乎每週都在重塑自己的工作方式。

我們會不斷識別瓶頸，而瓶頸一直在轉移。以前瓶頸是程式碼生成，後來變成程式碼評審，現在更多是：怎麼更快理解使用者需求？怎麼處理 issue ？怎麼追蹤 Twitter 、 Reddit 等重要平台上的回饋，並把這些資訊綜合成產品策略？

大家都在嘗試最大化利用 Agent 來做這些事。

前幾天有個有趣的場景，有人想加入 Codex 團隊，他問我：「在 OpenAI 做產品，我能分到多少算力？」

這個問題很新鮮。我們確實有很多算力，但我從來沒想過「每個員工的算力額度」。通常算力更多是留給訓練大模型的研究員。

現在大家意識到，你可以用算力把自己的能力放大很多倍。如果你有好的品味、好的想法、懂軟體開發，這個時代真的令人興奮。你能做到的事情太驚人了。

Agent會成為產品工程師

主持人：站在更宏觀的角度， OpenAI 一直招聘的是「產品型工程師」。現在他們的工作發生了什麼變化？

Raji：本質上，我們還是在為人類建構產品。產品直覺仍然很重要。我最近在用新版 Codex 的桌面應用，它讓寫程式碼更容易了。但產品開發還是要從「我們要建構什麼」開始，然後不斷迭代優化。

只要我們還是在為人類做軟體，這一點不會變。

當然，未來某個時間點，也許我們會為 Agent 建構軟體。那時候， Agent 可能會成為產品經理或產品工程師。

不過現在的節奏更快，也更有趣。建構軟體變得更爽了，因為回饋週期大幅縮短。

我有一次在飛機上寫程式碼。當時沒法用遠端 dev box 。空乘讓關電腦，我都捨不得，因為不想讓 Agent 停下來，只能半掩著電腦。（笑）現在很多人都是電腦半合著跑任務。

說實話，現在開發軟體比以前更好玩。你能快速看到成果，測試、驗證，然後再回到 Codex 調整。

新的工程實踐：

平行探索方案、設計師寫程式碼；程式碼評審成了瓶頸

主持人：工程實踐方面，有什麼新的、奇怪但合理的變化？

Tibo：以前遇到複雜技術權衡，我們會寫設計文件，討論各種方案，然後選一個。

現在有趣的地方在於，大家會平行探索多個實作方案，然後透過實驗資料選出最優解。

還有一個變化是角色邊界在模糊。設計師現在寫的程式碼，可能比六個月前工程師寫的還多。這是因為模型已經足夠好，生成的程式碼品質可以直接合併。

主持人：還有其他觀察嗎？

Raji：有。比如命令列工具。像 ffmpeg 這種工具，幾乎沒人能記住完整命令。現在用 Codex ，你只要說「我要做這個」，它就幫你產生命令並執行。

我們已經從單純「寫程式碼」，擴充到「程式碼評審」「安全審查」。

當編碼效率提升五倍之後，會發生什麼？程式碼量暴增，程式碼評審成為瓶頸。再往後，整合與部署（ CI/CD ）會成為新的瓶頸。

瓶頸在不斷遷移。這場變革還遠沒結束。

Tibo：所以我們必須不斷去解決下一批問題。這其實非常令人興奮。

主持人： Tibo ，我們之前聊到一個我從沒聽說過的做法 ——「通宵執行」和「自我測試」。能講講嗎？這聽起來很新。

Codex通宵執行與自我測試

Tibo：很容易把 Codex 理解成「超級自動補完」，覺得它只是幫你實作一個小功能， 10 分鐘搞定。

但我們看到的是，只要給模型一個足夠大的任務，它的能力遠不止如此。它可以連續執行好幾個小時。

我們為 Codex 搭建了完整的環境和能力，讓它可以完全自主地測試自己。我們會在夜間執行，讓它循環執行 QA ，自動檢測迴歸問題。

還有件事挺有意思。我常跟團隊裡負責訓練模型的研究員聊天。他說，每次他覺得自己比 Codex 更厲害時，最後都會發現是自己 prompt 沒寫好，或者環境沒設定對。

這既令人興奮，也有點打擊人。（笑）

現在它甚至可以獨立完成一次完整的模型訓練，最後寫一份帶有自己洞察的 PDF 報告。我們再從中挑出最有前景的方向，繼續迭代，然後再丟回 Codex 。

這種超長時間執行的任務，以及模型獨立完成複雜工作的能力，看著真的很震撼。

會議裡「召喚」Codex的兩個場景：

複盤和故障處理

主持人：還有一個很科幻的場景。你說 Codex 團隊開會討論 Codex 時，會直接在會議室裡發起 Codex 執行緒來診斷問題。這聽起來像自我循環。能講講嗎？

Tibo：我們有兩個典型場景。

第一是每週的分析複盤會議。我們會看功能採用率、留存率、轉換漏斗。會議開始時，大家總會有一些儀錶盤裡看不到的問題。

資料分析師會說：「好，我們後台開一個 Codex 執行緒， 20 分鐘後給答案。」

會議最後 10 分鐘，我們就能討論這些新結果。一個會議裡可能跑五六個問題。感覺像是有一群隱形顧問在後台為我們工作。

第二個場景是線上故障處理。 Codex 會幫助我們分析問題原因，找出最快的恢復路徑。資訊收集和問題解決速度都被大幅提升。

關於應屆生和初級工程師

主持人：行業內一個反覆出現的問題是：應屆生怎麼辦？初級工程師怎麼辦？我聽 OpenAI 工程負責人說，你們在大量招聘早期工程師。情況如何？

Raji：我們確實在招很多應屆生。今年還有一個規模不小的實習項目。

我相信新一代軟體工程師會是「AI 原生」的。他們會天然熟悉這些工具，從第一天就能使用 AI 。給他們這樣的環境至關重要。

今年夏天我們會迎來第一批大規模應屆生，大概 100 人左右。我很期待看到他們的表現。實習項目也會持續擴張。

這是一個很有意思的時代。

Codex 團隊如何帶新人？

扁平管理，Codex是第一個導師

主持人： Tibo ，你們團隊本身比公司其他團隊還領先幾步。新人加入時，怎麼快速上手？

Tibo：我的團隊結構非常扁平。我有 33 個直接彙報物件。我不想成為瓶頸。

如果一個人需要參與每個決策，這種結構在現在這個速度下行不通。

新人入職後，第一個「導師」其實是 Codex 本身。你直接問它問題，用它瀏覽程式碼庫，理解專案，接收每日報告。

而真正負責 onboarding 和文化建設的，往往是最近剛入職的人。

說到應屆生，我六個月前招了一個非常優秀的新人。他表現極其出色。一開始我有點驚訝。但後來我意識到，他有無限的精力和極快的學習能力。

說實話，我的腦子可能已經在走下坡路了，他的大腦正處在巔峰狀態。（笑）他在團隊裡取得的成功讓我非常開心。

新人建議：基礎永不過時

主持人：站在「唱反調」的角度看，過去我們看到很多應屆生成長為優秀工程師，是因為打下了堅實基礎。

現在如果新人一開始就大量依賴 AI ，跳過了我們過去 10 到 20 年的訓練過程，會不會缺乏基礎？

Tibo：基礎依然非常重要。

我們非常重視程式碼庫的整體架構設計，也非常重視程式碼評審。我們不會閉著眼睛完全依賴 Codex 。有頂級工程師在把關。

只要程式碼結構設計合理，設定好護欄，新人會變得極其高效。關鍵在於你搭建什麼樣的環境，以及提前思考程式碼庫未來如何演進。

軟體工程師角色變了

主持人：如果現在有個新人問：「Raji ，我每天具體要做什麼？」軟體工程師的日常和六到八個月前相比有什麼變化？

Raji：基礎永遠不會過時。我們能坐在這裡，是因為我們有扎實的基礎。但軟體工程師這個角色，確實已經發生了很大的變化。

我可能暴露年齡了，在這個行業 25 年，我見過太多範式轉移。我當年在 Microsoft 做開發者工具，寫過 Visual Studio 的編輯器和語言服務。第一次看到 IntelliSense 的時候，那種感覺真的很酷 —— 你敲一個點，所有選項自動彈出來。

主持人：我那時候剛入行，身邊的開發者還在說：「用 IntelliSense 的不算真正的程式設計師。」

Raji：對。（笑）再往前可能還有人覺得，不寫組合語言就不算好工程師。後來是 C++ ，再後來抽象層越來越高。還記得當年大家抱怨 JavaScript 嗎？

這些爭論其實都不重要。只要你有扎實的基礎，有產品直覺，知道自己在建構什麼，能夠在技術堆疊上下游自由穿梭去解決問題，這些能力才是關鍵。而且這永遠不會過時。

產品經理、設計師：都在寫程式碼

直接把設計推進到驗證後的原型

主持人：我們剛才主要在聊工程師。那產品經理和設計師呢？當工程師和他們都能更快建構功能時，他們的角色會怎麼變化？會不會越來越趨同？

Raji：只要我們還在為人類建構產品，就一定需要人類設計師和產品經理。產品感和設計感沒有簡單替代品。

當然，他們也在進化，效率越來越高。產品經理在寫程式碼，設計師也在寫程式碼。他們把設計直接推進到原型階段，驗證之後再交給工程師。

產品經理也在用 Codex 做 PowerPoint ，寫 Excel 外掛程式。效率提升發生在整個組織層面，不只是工程師。

內部的知識共享與「Show & Tell」

主持人：你們在內部做了很多知識共享，比如 show and tell 。怎麼想到的？機制是什麼？有沒有一些有趣的案例？

Tibo：我們其實是在一邊發現技術，一邊跟它一起進化。

和外界一樣，我們也在探索： AI 到底能為組織做什麼？對專案意味著什麼？只要有一個方向看起來有效，我們就盡快發布給世界。所以，我們真正「多看見一點未來」的時間視窗其實非常短。

在這種環境下，好點子必須快速在組織內擴散。我們有很活躍的 Slack 頻道，比如 Codex 頻道、 hot tips 頻道。也定期舉辦黑客松和 show and tell 。

這是一個高度創造性的階段，沒有所謂唯一正確的用法，一切都在探索中。

我們 Codex 團隊有一位非常優秀的產品經理， Alexander Emberos 。他是整個團隊唯一的產品經理，卻把自己「超級放大」。

前幾天他組織了一次 bug bash ，一個小時內大家體驗即將發布的功能。他讓 Codex 收集回饋，產生 Notion 文件，再讓 Codex 建立 bug 和功能改進任務到 Linear ，分配給相關負責人，並自動跟進進展。

他用 AI 把自己變成了 10 倍甚至 50 倍效率的專案經理。

但關鍵在於，你不能讓產品經理成為新的瓶頸。組織結構也要隨之調整。

Raji：我補充一點。最近的 demo day 和黑客松，我發現一個趨勢：展示的專案深度越來越高。

以前可能只是展示「這個能力可以做什麼」。現在很多 demo 已經處理了大量邊界情況，幾乎是可直接使用的產品。整體深度在持續提升。

Token 成本問題

主持人：有個必須說明的現實是，在 OpenAI 內部大家有無限 token 。外部世界成本還是問題。訂閱額度用完就得額外付費。很多團隊受限於預算。

如果別人受到成本約束，有什麼建議？

Raji：成本是我們持續思考的問題。我們希望模型更強，也希望提供給使用者。

但思維方式也需要轉變。你現在擁有的是一個 24/7 工作的隊友。你可以給它分配 Linear 或 Jira 任務，並且應該期待它完成。

問題不再是「用了多少 token 」，而是「你願意為這個隊友付多少錢」。

如果每個工程師擁有四五個這樣的「隊友」，從生產力角度衡量就更合理了。

當然，我們必須讓這些 Agent 足夠強，真正配得上「隊友」的稱呼。

Tibo：還可以從公司整體成本結構看。比如市場調查研究、分析功能積壓清單、篩選哪些任務容易實作 —— 過去可能需要 15 個工程師一起做，現在幾乎免費。

不是每家公司都能給員工無限推理額度。但過早嚴格限制，也是一種風險。

我們仍處在極早期階段，很多人還沒有真正學會如何把自己放大。

我的建議是：把充足的推理額度優先給公司裡最優秀的人。讓他們充分探索。

變化的速度

主持人：變化真的很快。回看過去的 25 年，有沒有類似的時刻？

Raji：我從沒見過這樣的變化。

我經歷過網際網路泡沫破裂、 Y2K 、行動革命，也參與過社交網路浪潮。但這一次完全不同。

Raji：這一波變化正在以巨大的規模發生，而且速度極快。快到有些圖表看起來都已經不太講得通了。所以我確實認為，這是一段非常特殊、非常獨一無二的時期。能夠生活在這樣的時代，本身就很酷。

接下來，在「智慧型體」之上繼續抽象，

工程師無需關注程式碼，只需專注輸入和輸出

主持人：作為最後一個問題，雖然變化非常快，但你們兩位已經在 OpenAI 工作了相當一段時間。我想請你們做一個坦誠的預測：兩年之後，軟體工程會是什麼樣子？工程管理又會變成什麼樣？基於你們目前所了解的一切。

Raji：顯然，兩年這個時間尺度實在太長了。

我覺得六個月之後的事情都已經很難說。不過有幾件事我相當有信心。第一，我們的速度可能還會再提升一個數量級，這又會帶來新一輪改變。第二，我們會真正跑通大規模的多智慧型體協作網路，讓它們圍繞非常宏大的目標協同工作。

舉個例子，在 Cursor 展示的能力基礎上，完全可以想像這樣一個場景：你說一句「從零開始重建一個瀏覽器」，然後 24 小時之後，你就得到一個成品。那可能是兩百萬行程式碼構成的系統，規模龐大到人類幾乎無法完全理解其內部細節。

我認為接下來我們會做的是，為建構出來的系統設立「護欄」。這樣你就不必再逐行查看程式碼，而是透過某種方式驗證它的正確性，或者透過約束確保它的安全性。你只需要關注輸入和輸出。程式碼本身會被抽象掉，真正的焦點將轉向問題本身，以及系統應具備的性質。

軟體的發展史，本質上就是抽象層級不斷提升的歷史。抽象讓我們用更少的程式碼建構更龐大的產品。多年來抽象層級持續上升，而現在，我們正處在一個抽象加速躍遷的階段。

但我也有一點擔憂。任何足夠複雜或精密的系統，都更難調試。我們往往只能透過症狀來定位問題。我想幾年之後，軟體將會複雜到前所未有，層層疊疊。我們會非常擅長透過「症狀」識別問題，我們的工具也會變得非常擅長做這件事。我認為，這將成為軟體開發者需要掌握的一種獨特能力。

Tibo： Raji 講得很好，我想補充一點關於未來的樣子。

我覺得很快，你只需要和自己的助手對話，就可以檢查工作進展。你會擁有一個專屬的「個人代表型助手」，它能夠彙總代表所有在後台為你高效工作的 AI 智慧型體。你不必再去監控、逐個查看一百個甚至兩百個小型 Agent 的狀態。

我認為這種形態會很快出現，甚至就在今年。

主持人：非常感謝 Raji和 Tibo ，為我們揭示了內部正在發生的事情，以及你們團隊的工作方式。感覺你們總是領先幾週、幾個月，甚至更久。但這一切確實正在發生。同時，也感謝你們對這個激動人心時代的展望。非常感謝。

Raji/ Tibo： 謝謝。

參考連結：

https://www.youtube.com/watch?v=Bo6Gtq3nMXc