Codex負責人自曝OpenAI內部開發:每週都在重塑!Codex已經化成隊友,可通宵運行、自我測試!新人建議:基礎永不過時;Win版本將上線

圖片

圖片

編輯 | 雲昭

「未來某個時間點,也許我們會為Agent建構軟體。那時候,Agent可能會成為產品經理或產品工程師。」

昨天,OpenAI Codex 工程主管 Tibo Sottiaux 和 OpenAI 應用首席技術官 Vijaye Raji 做客 Pragmatic Summit,對外分享了 OpenAI 內部工程師的真實體感和感受。

回顧過去的 2025年, Tibo 表示變化程度可以用「震撼」來形容。

哪怕只看最近六個月,我們已經從「把 Codex 當工具」,到「把它當擴充」,再到「把它當Agent」,現在已經進化到「把它當隊友」。
有工程師甚至一週能消耗上千億的token,來跑多個Agent。

伴隨著Codex越來越強的能力,軟體開發這件事的瓶頸,甚至以週為單位發生變化:

以前瓶頸是程式碼生成,後來變成程式碼評審,現在更多是:怎麼更快理解使用者需求?怎麼處理 issue ?怎麼追蹤 Twitter 、 Reddit 等重要平台上的回饋,並把這些資訊綜合成產品策略?

甚至Tibo還爆料說:OpenAI內部一些工程師每週消耗的 token 數量達到數千億級別。而且這還不是單個 Agent 。

而且內部還有相較於外界更「科幻」的開發工具:Codex Box。

上週我們內部發布了 Codex Box,可以在伺服器上預留開發環境,直接發 prompt 讓它去幹活。你在筆記型電腦上編排流程,它在雲端執行任務。很多人關上電腦去開會,回來時工作已經完成。

再比如,Codex 團隊開會討論 Codex 時,會直接在會議室裡發起 Codex 執行緒來診斷問題和複盤分析。

提及未來,軟體開發這個行業會怎麼變化。Tibo 和 Raji 給出了幾個方向。

首先,開發 的速度可能還會再提升一個數量級,這又會帶來新一輪改變。

其次,OpenAI 會真正跑通大規模的多智慧型體協作網路,讓它們圍繞非常宏大的目標協同工作。

第三,接下來,會為上面建構出來的系統建構護欄,開發者 不必再逐行查看程式碼,而是透過某種方式驗證它的正確性,或者透過約束確保它的安全性。而程式碼本身則會被抽象掉,真正的焦點轉向問題本身,以及系統應具備的性質。

第四,Raji 提到,也許就在今年,開發者會擁有一個幫助自己檢查一兩百個小型Agent狀態的 專屬的「個人代表型助手」, 它能夠彙總代表所有在後台為你高效工作的 AI 智慧型體。你不必再去監控、逐個查看。 (ps:有點像昨天小編報道的前Github CEO下場做的 Entire!)

另外,主持人還爆料到,OpenAI 傾向於招募產品型工程師。Raji 解釋道,產品直覺依舊很重要,畢竟本質上,產品還是為人建構的。

對於在AI時代想從事軟體行業的新人而言,Tibo 和 Raji 都表示:基礎能力永遠不會過時!OpenAI不會閉著眼睛完全依賴 Codex 。

只要你有扎實的基礎,有產品直覺,知道自己在建構什麼,能夠在技術堆疊上下游自由穿梭去解決問題,這些能力才是關鍵。而且這永遠不會過時。

「我們能坐在這裡,是因為我們有扎實的基礎。但軟體工程師的角色, 確實已經發生了很大的變化!」

最後,多說一嘴,幾個小時前,Tibo 還宣布重磅消息:Codex 已經開始邀測 Window版本。

毫無疑問,這意味著 OpenAI 在企業端開發者繼續加碼了。

圖片

以下是小編為大家梳理的Codex團隊版本的「程式設計師進化故事」。

OpenAI內部開發發生了什麼:

Codex已進化成隊友

一些工程師每週消耗token數量高達千億級別

主持人:有個很多人都在問的問題: OpenAI 現在內部到底發生了什麼?更具體一點,從軟體開發的角度來看,工程師的工作方式到底怎麼變了?

Raji:你問得好,確實發生了很多變化。我在 OpenAI 大概六個月了,其中一個最深的感受是,公司內部的研究能力實在太強了。你只要往未來稍微投射一下那些可能性,就會覺得震撼。

先說軟體開發方式。 Codex 徹底改變了我們寫程式碼的方式。變化非常劇烈。哪怕只看最近六個月, 我們已經從「把 Codex 當工具」,到「把它當擴充」,再到「把它當 Agent 」,現在已經進化到「把它當隊友」。 我甚至覺得,工程師很快就會給自己的 Agent 起名字,把它當成真正的搭檔。這種變化發生得非常快。

我看過內部的排行榜,有些工程師每週消耗的 token 數量達到數千億級別。而且這還不是單個 Agent 。 上週我們內部發布了 Codex Box,可以在伺服器上預留開發環境,直接發 prompt 讓它去幹活。你在筆記型電腦上編排流程,它在雲端執行任務。很多人關上電腦去開會,回來時工作已經完成。

這就是現在 OpenAI 內部的軟體開發方式。它已經發生了根本性的改變。 我相信幾個月內,矽谷中心地帶會率先普及,然後擴散開來。以後大家都會這麼開發軟體。

主持人:如果我回到六個月甚至一年前,聽你這麼說,我可能會覺得你在講童話故事。但現在不一樣了,很多人都在用。我自己也在用。我也跟 OpenAI 的工程師聊過。我很喜歡跟工程師聊,因為他們幾乎沒有「媒體訓練」,說話很直接。

讓我有點安心的是, 並不是所有工程師都 100% 用 Codex 寫程式碼 。大家用得很多,但層級不同。有一個團隊確實走在前沿,那就是 Codex 團隊。

Tibo ,你帶 Codex 團隊。能不能講講你們現在每天怎麼工作?工程師的典型工作流是什麼樣?

Codex 團隊的工作方式每週都在快速變化

Tibo:情況變化非常快。 Codex 團隊有個很有意思的特點:我們幾乎每週都在重塑自己的工作方式。

我們會不斷識別瓶頸,而瓶頸一直在轉移。以前瓶頸是程式碼生成,後來變成程式碼評審, 現在更多是:怎麼更快理解使用者需求?怎麼處理 issue ?怎麼追蹤 Twitter 、 Reddit 等重要平台上的回饋,並把這些資訊綜合成產品策略?

大家都在嘗試最大化利用 Agent 來做這些事。

前幾天有個有趣的場景,有人想加入 Codex 團隊,他問我:「在 OpenAI 做產品,我能分到多少算力?」

這個問題很新鮮。我們確實有很多算力,但我從來沒想過「每個員工的算力額度」。通常算力更多是留給訓練大模型的研究員。

現在大家意識到,你可以用算力把自己的能力放大很多倍。如果你有好的品味、好的想法、懂軟體開發,這個時代真的令人興奮。你能做到的事情太驚人了。

Agent會成為產品工程師

主持人:站在更宏觀的角度, OpenAI 一直招聘的是「產品型工程師」。 現在他們的工作發生了什麼變化?

Raji:本質上,我們還是在為人類建構產品。產品直覺仍然很重要。 我最近在用新版 Codex 的桌面應用,它讓寫程式碼更容易了。但產品開發還是要從「我們要建構什麼」開始,然後不斷迭代優化。

只要我們還是在為人類做軟體,這一點不會變。

當然, 未來某個時間點,也許我們會為 Agent 建構軟體。 那時候, Agent 可能會成為產品經理或產品工程師。

不過現在的節奏更快,也更有趣。 建構軟體變得更爽了,因為回饋週期大幅縮短。

我有一次在飛機上寫程式碼。當時沒法用遠端 dev box 。空乘讓關電腦,我都捨不得,因為不想讓 Agent 停下來,只能半掩著電腦。(笑) 現在很多人都是電腦半合著跑任務。

說實話,現在開發軟體比以前更好玩。你能快速看到成果,測試、驗證,然後再回到 Codex 調整。

新的工程實踐:

平行探索方案、設計師寫程式碼;程式碼評審成了瓶頸

主持人:工程實踐方面,有什麼新的、奇怪但合理的變化?

Tibo:以前遇到複雜技術權衡,我們會寫設計文件,討論各種方案,然後選一個。

現在有趣的地方在於, 大家會平行探索多個實作方案,然後透過實驗資料選出最優解。

還有一個變化是 角色邊界在模糊。設計師現在寫的程式碼 ,可能比六個月前工程師寫的還多。這是因為模型已經足夠好,生成的程式碼品質可以直接合併。

主持人:還有其他觀察嗎?

Raji:有。比如命令列工具。像 ffmpeg 這種工具, 幾乎沒人能記住完整命令 。現在用 Codex ,你只要說「我要做這個 」,它就幫你產生命令並執行。

我們已經從單純「寫程式碼 」,擴充到「程式碼評審 」「安全審查 」。

當編碼效率提升五倍之後,會發生什麼?程式碼量暴增,程式碼評審成為瓶頸。再往後,整合與部署( CI/CD )會成為新的瓶頸。

瓶頸在不斷遷移。這場變革還遠沒結束。

Tibo:所以我們必須不斷去解決下一批問題。這其實非常令人興奮。

主持人: Tibo ,我們之前聊到一個我從沒聽說過的做法 ——「通宵執行」和「自我測試」。能講講嗎?這聽起來很新。

Codex通宵執行與自我測試

Tibo:很容易把 Codex 理解成「超級自動補完」,覺得它只是幫你實作一個小功能, 10 分鐘搞定。

但我們看到的是,只要給模型一個足夠大的任務,它的能力遠不止如此。它可以連續執行好幾個小時。

我們為 Codex 搭建了完整的環境和能力, 讓它可以完全自主地測試自己。我們會在夜間執行,讓它循環執行 QA ,自動檢測迴歸問題。

還有件事挺有意思。我常跟團隊裡負責訓練模型的研究員聊天。他說,每次他覺得自己比 Codex 更厲害時,最後都會發現是自己 prompt 沒寫好,或者環境沒設定對。

這既令人興奮,也有點打擊人。(笑)

現在它甚至可以獨立完成一次完整的模型訓練,最後寫一份帶有自己洞察的 PDF 報告。我們再從中挑出最有前景的方向,繼續迭代,然後再丟回 Codex 。

這種超長時間執行的任務,以及模型獨立完成複雜工作的能力,看著真的很震撼。

會議裡「召喚」Codex的兩個場景:

複盤和故障處理

主持人:還有一個很科幻的場景。你說 Codex 團隊開會討論 Codex 時,會直接在會議室裡發起 Codex 執行緒來診斷問題。這聽起來像自我循環。能講講嗎?

Tibo:我們有兩個典型場景。

第一是每週的分析複盤會議。 我們會看功能採用率、留存率、轉換漏斗。會議開始時,大家總會有一些儀錶盤裡看不到的問題。

資料分析師會說:「好,我們後台開一個 Codex 執行緒, 20 分鐘後給答案。」

會議最後 10 分鐘,我們就能討論這些新結果。一個會議裡可能跑五六個問題。感覺像是有一群隱形顧問在後台為我們工作。

第二個場景是線上故障處理。 Codex 會幫助我們分析問題原因,找出最快的恢復路徑。資訊收集和問題解決速度都被大幅提升。

關於應屆生和初級工程師

主持人:行業內一個反覆出現的問題是:應屆生怎麼辦?初級工程師怎麼辦?我聽 OpenAI 工程負責人說,你們在大量招聘早期工程師。情況如何?

Raji:我們確實在招很多應屆生。今年還有一個規模不小的實習項目。

我相信新一代軟體工程師會是「AI 原生 」的。他們會天然熟悉這些工具,從第一天就能使用 AI 。給他們這樣的環境至關重要。

今年夏天我們會迎來第一批大規模應屆生,大概 100 人左右。我很期待看到他們的表現。實習項目也會持續擴張。

這是一個很有意思的時代。

Codex 團隊如何帶新人?

扁平管理,Codex是第一個導師

主持人: Tibo ,你們團隊本身比公司其他團隊還領先幾步。新人加入時,怎麼快速上手?

Tibo:我的團隊結構非常扁平。我有 33 個直接彙報物件。我不想成為瓶頸。

如果一個人需要參與每個決策,這種結構在現在這個速度下行不通。

新人入職後,第一個「導師」其實是 Codex 本身。你直接問它問題,用它瀏覽程式碼庫,理解專案,接收每日報告。

而真正負責 onboarding 和文化建設的,往往是最近剛入職的人。

說到應屆生,我六個月前招了一個非常優秀的新人。他表現極其出色。一開始我有點驚訝。但後來我意識到,他有無限的精力和極快的學習能力。

說實話,我的腦子可能已經在走下坡路了,他的大腦正處在巔峰狀態。(笑)他在團隊裡取得的成功讓我非常開心。

新人建議:基礎永不過時

主持人:站在「唱反調」的角度看,過去我們看到很多應屆生成長為優秀工程師,是因為打下了堅實基礎。

現在如果新人一開始就大量依賴 AI ,跳過了我們過去 10 到 20 年的訓練過程,會不會缺乏基礎?

Tibo:基礎依然非常重要。

我們非常重視程式碼庫的整體架構設計,也非常重視程式碼評審。 我們不會閉著眼睛完全依賴 Codex 。有頂級工程師在把關。

只要程式碼結構設計合理,設定好護欄,新人會變得極其高效。關鍵在於你搭建什麼樣的環境,以及提前思考程式碼庫未來如何演進。

軟體工程師角色變了

主持人:如果現在有個新人問:「Raji ,我每天具體要做什麼?」軟體工程師的日常和六到八個月前相比有什麼變化?

Raji:基礎永遠不會過時。我們能坐在這裡,是因為我們有扎實的基礎。但軟體工程師這個角色,確實已經發生了很大的變化。

我可能暴露年齡了,在這個行業 25 年,我見過太多範式轉移。我當年在 Microsoft 做開發者工具,寫過 Visual Studio 的編輯器和語言服務。第一次看到 IntelliSense 的時候,那種感覺真的很酷 —— 你敲一個點,所有選項自動彈出來。

主持人:我那時候剛入行,身邊的開發者還在說:「用 IntelliSense 的不算真正的程式設計師。」

Raji:對。(笑)再往前可能還有人覺得,不寫組合語言就不算好工程師。後來是 C++ ,再後來抽象層越來越高。還記得當年大家抱怨 JavaScript 嗎?

這些爭論其實都不重要。只要你有扎實的基礎,有產品直覺,知道自己在建構什麼,能夠在技術堆疊上下游自由穿梭去解決問題,這些能力才是關鍵。而且這永遠不會過時。

產品經理、設計師:都在寫程式碼

直接把設計推進到驗證後的原型

主持人:我們剛才主要在聊工程師。那產品經理和設計師呢?當工程師和他們都能更快建構功能時,他們的角色會怎麼變化?會不會越來越趨同?

Raji:只要我們還在為人類建構產品,就一定需要人類設計師和產品經理。產品感和設計感沒有簡單替代品。

當然,他們也在進化,效率越來越高。 產品經理在寫程式碼,設計師也在寫程式碼。他們把設計直接推進到原型階段,驗證之後再交給工程師。

產品經理也在用 Codex 做 PowerPoint ,寫 Excel 外掛程式。效率提升發生在整個組織層面,不只是工程師。

內部的知識共享與「Show & Tell」

主持人:你們在內部做了很多知識共享,比如 show and tell 。怎麼想到的?機制是什麼?有沒有一些有趣的案例?

Tibo:我們其實是在一邊發現技術,一邊跟它一起進化。

和外界一樣,我們也在探索: AI 到底能為組織做什麼?對專案意味著什麼?只要有一個方向看起來有效,我們就盡快發布給世界。所以,我們真正「多看見一點未來」的時間視窗其實非常短。

在這種環境下,好點子必須快速在組織內擴散。我們有很活躍的 Slack 頻道,比如 Codex 頻道、 hot tips 頻道。也定期舉辦黑客松和 show and tell 。

這是一個高度創造性的階段,沒有所謂唯一正確的用法,一切都在探索中。

我們 Codex 團隊有一位非常優秀的產品經理, Alexander Emberos 。他是整個團隊唯一的產品經理,卻把自己「超級放大」。

前幾天他組織了一次 bug bash ,一個小時內大家體驗即將發布的功能。他讓 Codex 收集回饋,產生 Notion 文件,再讓 Codex 建立 bug 和功能改進任務到 Linear ,分配給相關負責人,並自動跟進進展。

他用 AI 把自己變成了 10 倍甚至 50 倍效率的專案經理。

但關鍵在於,你不能讓產品經理成為新的瓶頸。組織結構也要隨之調整。

Raji:我補充一點。最近的 demo day 和黑客松,我發現一個趨勢:展示的專案深度越來越高。

以前可能只是展示「這個能力可以做什麼」。現在很多 demo 已經處理了大量邊界情況,幾乎是可直接使用的產品。整體深度在持續提升。

Token 成本問題

主持人:有個必須說明的現實是,在 OpenAI 內部大家有無限 token 。外部世界成本還是問題。訂閱額度用完就得額外付費。很多團隊受限於預算。

如果別人受到成本約束,有什麼建議?

Raji:成本是我們持續思考的問題。我們希望模型更強,也希望提供給使用者。

但思維方式也需要轉變。你現在擁有的是一個 24/7 工作的隊友。你可以給它分配 Linear 或 Jira 任務,並且應該期待它完成。

問題不再是「用了多少 token 」,而是「你願意為這個隊友付多少錢 」。

如果每個工程師擁有四五個這樣的「隊友」,從生產力角度衡量就更合理了。

當然,我們必須讓這些 Agent 足夠強,真正配得上「隊友」的稱呼。

Tibo:還可以從公司整體成本結構看。比如市場調查研究、分析功能積壓清單、篩選哪些任務容易實作 —— 過去可能需要 15 個工程師一起做,現在幾乎免費。

不是每家公司都能給員工無限推理額度。但過早嚴格限制,也是一種風險。

我們仍處在極早期階段,很多人還沒有真正學會如何把自己放大。

我的建議是:把充足的推理額度優先給公司裡最優秀的人。讓他們充分探索。

變化的速度

主持人:變化真的很快。回看過去的 25 年,有沒有類似的時刻?

Raji:我從沒見過這樣的變化。

我經歷過網際網路泡沫破裂、 Y2K 、行動革命,也參與過社交網路浪潮。但這一次完全不同。

Raji:這一波變化正在以巨大的規模發生,而且速度極快。 快到有些圖表看起來都已經不太講得通了。 所以我確實認為,這是一段非常特殊、非常獨一無二的時期。能夠生活在這樣的時代,本身就很酷。

接下來,在「智慧型體」之上繼續抽象,

工程師無需關注程式碼,只需專注輸入和輸出

主持人:作為最後一個問題,雖然變化非常快,但你們兩位已經在 OpenAI 工作了相當一段時間。我想請你們做一個坦誠的預測:兩年之後,軟體工程會是什麼樣子?工程管理又會變成什麼樣?基於你們目前所了解的一切。

Raji:顯然,兩年這個時間尺度實在太長了。

我覺得六個月之後的事情都已經很難說。不過有幾件事我相當有信心。 第一,我們的速度可能還會再提升一個數量級,這又會帶來新一輪改變。第二,我們會真正跑通大規模的多智慧型體協作網路,讓它們圍繞非常宏大的目標協同工作。

舉個例子,在 Cursor 展示的能力基礎上,完全可以想像這樣一個場景:你說一句「從零開始重建一個瀏覽器 」,然後 24 小時之後,你就得到一個成品。那可能是兩百萬行程式碼構成的系統,規模龐大到人類幾乎無法完全理解其內部細節。

我認為接下來我們會做的是,為建構出來的系統設立「護欄」。 這樣你就不必再逐行查看程式碼,而是透過某種方式驗證它的正確性,或者透過約束確保它的安全性。 你只需要關注輸入和輸出。程式碼本身會被抽象掉,真正的焦點將轉向問題本身,以及系統應具備的性質。

軟體的發展史,本質上就是抽象層級不斷提升的歷史。抽象讓我們用更少的程式碼建構更龐大的產品。 多年來抽象層級持續上升,而現在,我們正處在一個抽象加速躍遷的階段。

但我也有一點擔憂。任何足夠複雜或精密的系統,都更難調試。我們往往只能透過症狀來定位問題。我想幾年之後,軟體將會複雜到前所未有,層層疊疊。我 們會非常擅長透過「症狀」識別問題,我們的工具也會變得非常擅長做這件事。 我認為,這將成為軟體開發者需要掌握的一種獨特能力。

Tibo: Raji 講得很好,我想補充一點關於未來的樣子。

我覺得很快,你只需要和自己的助手對話,就可以檢查工作進展。你會擁有一個 專屬的「個人代表型助手」, 它能夠彙總代表所有在後台為你高效工作的 AI 智慧型體。你不必再去監控、逐個查看一百個甚至兩百個小型 Agent 的狀態。

我認為這種形態會很快出現,甚至就在今年。

主持人:非常感謝 Raji和 Tibo ,為我們揭示了內部正在發生的事情,以及你們團隊的工作方式。感覺你們總是領先幾週、幾個月,甚至更久。但這一切確實正在發生。同時,也感謝你們對這個激動人心時代的展望。非常感謝。

Raji/ Tibo: 謝謝。

參考連結:

https://www.youtube.com/watch?v=Bo6Gtq3nMXc


分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.