我們從一開始就是使用 Devin 來建構 Devin。上週,我們將 659 個 Devin 產生的拉取請求(PR)合併到我們自己的程式碼庫中,這個數字比 2025 年表現最好的一週的 154 個大幅成長。
許多人都知道 Devin 是一個網頁應用程式。在內部,我們會視工作起始點而定,在所有介面(網頁、Slack、Linear、CLI、API)中使用它。這篇文章將介紹我們如何充分利用這些工具。
核心體驗
設定是這樣的:我們新增任何希望 Devin 管理的程式碼庫。接著,我們會獲得一個統一的介面,可以使用自然語言在所有儲存庫中工作。
它被設計為對話式介面,所以我們可以用與隊友訊息往來相同的方式與它聊天,無論是透過 Slack、Linear 或 Jira 工單,或是網頁應用程式。在任何頻道中標記 @Devin。如有需要可附上檔案。就像在一般聊天介面中一樣來回溝通。

一個強大的成果是,任何人都能做出貢獻,無論其技術專長或在公司中的角色為何,他們不需要了解或設定 Git 或任何命令列工具就能開始為我們的程式碼庫做出貢獻。
標記 @Devin 並提出請求,我們就會收到一個可以審查和測試的 PR。例如,如果有人發現過時的文件或錯誤,他們只需在 Slack 中傳送一則簡短訊息來修復它,然後繼續處理其他工作。

這消除了快速迭代和優化的摩擦與障礙,並減少了切換工作脈絡的需要。
而且,當工程師看到隊友用 Devin 在他們每天使用的同一個程式碼庫中完成的成果時,他們會產生「噢,真的嗎?Devin 做得到這個?」的頓悟時刻,因此它便自然地傳播開來。
Ask Devin(程式碼庫問答)
一旦將儲存庫新增到 Devin,它就會自動建立索引。Ask Devin 成為通往該程式碼庫的視窗。
我們經常在開始工作階段之前使用它來界定工作範圍。工作流程是:使用 Ask Devin 探索程式碼並釐清目標,然後直接從搜尋介面啟動工作階段。
Devin 從我們的探索中獲得清晰的脈絡,提示也會自動針對我們的任務進行調整。

相同的工作流程也適用於 Jira 或 Linear 整合。在工單上標記 Devin。Devin 會分析任務、搜尋程式碼庫並規劃其方法。它會自動產生高品質的工作階段提示。

自動化程式碼審查
隨著我們使用智慧體推送更多程式碼,瓶頸從撰寫程式碼轉移到審查程式碼。Devin Review 將大型、複雜的 GitHub PR 轉換為直覺化組織的差異比對和精確的解釋。
我們現在每個 PR 都會使用它。

每當 Devin 在 Slack 中發布 PR 時,它都會包含一個 Devin Review 連結,因此只需點擊一下即可查看組織好的差異比對。

讓 Devin Review 實用的原因:
- 自動修正。如果 Devin Review 或 GitHub 機器人標記出錯誤,Devin 會自動修正 PR。Devin 還會處理 CI/lint 問題,直到所有檢查都通過,完成智慧體循環。
- 智慧差異組織。以邏輯方式將變更分組,將相關的編輯放在一起,而不是按字母順序排列。
- 複製和移動偵測。偵測程式碼何時被複製或移動,並乾淨地顯示變更,而不是完整的刪除和插入。
- 錯誤捕手。自動分析 PR 中潛在的問題,並依信心等級標記它們。嚴重錯誤需要立即關注。非嚴重錯誤仍應審查。標記為資訊性註解。
- 程式碼庫感知聊天。詢問有關 PR 的問題,並從程式碼庫的其他部分獲得具有相關背景資訊的答案。
對於任何 GitHub PR 連結,您可以將 github.com 替換為 devinreview.com。
設定自動審查後,Devin 會在 PR 開啟、推送新提交或新增某人為審查者時自動開始審查 PR。
設計系統
設計系統會逐漸偏離。有人硬編碼了一個十六進位值,另一個人建立了一個一次性按鈕,突然間我們就在維護多個真相來源。我們用兩種方式處理這個問題。
首先,任何人都可以在發現違規的當下立即修正。在 Slack 中標記 Devin 並附上螢幕截圖,它就會將元件遷移以符合設計系統。

其次,我們執行每日稽核。每天早上,Devin 會掃描過去 24 小時內合併的 PR,標記硬編碼的顏色、非標準間距以及應該使用共享元件庫的元件。它會為每個違規建立 Linear 工單,並選擇性地自動開啟修正 PR。
這種組合意味著無論是否有人注意到,違規都會被捕捉到。
錯誤分類自動化
當錯誤出現在 Linear 中時,必須有人停下手中的工作進行調查——閱讀工單、搜尋程式碼庫、檢查最近的提交——然後才能進行實際修復。我們自動化整個分類步驟。
我們設定了一個!triage-bug 手冊,捕捉我們工程師實際調查的方式:閱讀報告、搜尋相關程式碼路徑、檢查 git 歷史記錄,然後總結調查結果,包括根本原因和建議的修正方法。當任何人為工單新增Bug 標籤時,自動化就會觸發,無需指派。
像「週五部署後 /contact 出現 500 錯誤」這樣的工單,會變成 Devin 自動找到檔案、在 git log 中發現最近的規則運算式重構,並回傳摘要到 Linear:根本原因、受影響的檔案、建議的修正方法。
我們連接 Datadog MCP,讓 Devin 在調查期間檢查日誌。當工程師接手錯誤時,調查已經完成了。
端到端錯誤除錯
有些錯誤需要的不僅僅是分類。它們需要有人提取日誌、檢查資料庫、追蹤程式碼變更並撰寫修正方案。我們將 Devin 連接到 Datadog,並給予它只讀資料庫存取權限,以便它能執行完整的調查。
當錯誤報告進來時(例如「自週五部署以來,專業版使用者在帳單頁面看到『未定義』」),Devin 會從 Datadog 提取錯誤日誌、查詢唯讀複本來驗證資料狀態、在 git 歷史記錄中追蹤導致問題的服務提交、撰寫包含回歸測試的修正方案,並開啟 PR。
過去需要工程師中斷工作一小時的調查,現在在背景中完成。我們審查的是 PR,而不是日誌。
DANA(資料分析師智慧體)
DANA 是專為查詢資料庫、分析資料和建立視覺化而優化的 Devin 專用版本。
我們用它來詢問資料倉儲、建立儀表板,以及在不讓工程師中斷工作的情況下回答資料問題。它也成為非工程任務的首選,例如過去耗費時間的「點擊一堆按鈕來填寫報告」的工作。
我們可以透過點擊智慧體選擇器下拉選單從網頁應用程式存取 DANA,或是在 Slack 中使用 /dana 或@Devin !dana 後接我們的問題。

我們學會了要具體說明指標、包含時間範圍,並在需要時要求視覺化。
DANA 透過 MCP 連接到我們的資料倉儲——Redshift、PostgreSQL、Snowflake、BigQuery,無論我們運行什麼——並維護自己的資料庫知識,因此在我們提出任何問題之前,它已經了解我們的結構描述。它針對簡潔、以指標為中心的答案進行優化,內建 seaborn 視覺化功能,所以我們能快速獲得圖表和見解,而不必等待工程師切換脈絡到 SQL 用戶端。
我們發現它特別適用於那些過去在某人佇列中停留數天的即興問題。像「為什麼週二的註冊人數下降?」或「按企業版與自助服務區分消耗量」這樣的問題,團隊中的任何人都可以在 Slack 中直接提問,並附上 SQL 以便我們驗證邏輯。
DeepWiki
使用 DeepWiki,Devin 會自動索引所有儲存庫,並產生包含架構圖、來源連結和程式碼庫摘要的維基。Ask Devin 使用維基中的資訊來更好地理解和尋找相關脈絡。
對於公開儲存庫,deepwiki.com 會自動產生架構圖、來源連結和文件,無需任何設定。

我們也維護一個免費的 DeepWiki MCP。
手冊
手冊就像是針對重複性任務的自訂系統提示。如果我們發現在多個工作階段中重複相同的指令,那就是建立手冊的時候。

一旦有人成功使用 Devin,其他人就能複製這種成功。一個好的手冊包括:
- 我們希望 Devin 達成的成果
- 達成目標所需的步驟
- 描述後置條件的規格
- 修正 Devin 預設假設的建議
- 禁止的動作
- 啟動者所需的任何輸入或脈絡
我們使用手冊處理複雜的重複性工作——將資料導入 Redshift、執行資料庫遷移、整合 Stripe、Plaid 和 Modal。
MCP 市集
MCP 使 Devin 能夠使用數百種外部工具和資料來源。我們使用 MCP 來挖掘 Sentry、Datadog 和 Vercel 日誌。連接資料庫 MCP 以便在 Slack 中進行資料分析。從 Notion、Airtable 和 Linear 等工具中提取脈絡。

許多只需點擊一下即可啟用——Vercel、Atlassian、Notion、Sentry、Neon、Asana、Jam 等等。
例如,我們透過在 Slack 中標記 Devin 並使用 Redshift MCP 來繪製所有組織的累積 Linear 整合圖表——這為我們提供了每週細分、關鍵觀察結果和可分享的 Metabase 連結。

工作階段見解
工作階段見解會分析已完成的 Devin 工作階段,並提供可執行的改進建議。
在 Devin 完成任務後,工作階段見解會檢查:
- 問題與挑戰(技術問題、溝通落差、範圍蔓延)
- 包含關鍵里程碑和效率指標的工作階段時間軸
- 行動項目,包括即時改進和流程優化
- 包含增強指示的改進提示建議
我們使用一個工作階段的見解來為下一個工作階段提供資訊。我們可以直接從見解中使用改進後的提示啟動新的工作階段。隨著時間推移,工作階段變得更有效率。
API 存取
Devin 提供完整的 REST API,因此智慧體不需要人類參與即可開始工作。我們將 Devin 連接到現有系統並以程式化方式觸發工作階段:
- Sentry 出現崩潰日誌 → Devin 調查並開啟 PR
- 提交錯誤報告 → Devin 重現、診斷並修補
- 部署失敗 → Devin 分析日誌並建議修正方案
- 要求程式碼審查 → Devin 審查並留下評論
Devin 擅長的領域
Devin 可以承擔大多數工程工作,包括複雜任務。成功與具體程度成正比。範圍明確、標準清晰的任務能獲得最佳成果。
我們一致使用 Devin 的任務:
- 大量迭代改進
- 錯誤修正和邊界情況
- 提高測試覆蓋率
- 調查 CI 失敗
- lint 錯誤和 CVE 修復
- PR 審查
- 維護文件
- 修復靜態分析發現的安全性漏洞
- 程式碼庫問答
複雜任務的技巧
- 大規模挑戰應分解為跨多個工作階段的較小、獨立任務。
- Devin 擅長建立可運作的介面;將它們美化仍然是人類的優勢。
- 行動開發可行,但 Devin 沒有手機可以測試。
- 對於需要大量測試和驗證的任何事項,我們確保有驗證機制。
開始使用
最低設定
- 在app.devin.ai註冊
- 連接您的 GitHub、GitLab 或 Bitbucket
- 新增您的第一個儲存庫
- 從簡單任務開始工作階段
擴展規模 當您熟悉後:
- 新增知識以教導 Devin 您的程式碼庫慣例
- 為重複性任務建立手冊
- 連接 Slack 進行內嵌協作
- 為您的工具啟用 MCP
- 在開始工作階段之前使用 Ask Devin 來界定複雜工作範圍
將 Devin 視為團隊成員。給予它脈絡。教導它您的慣例。讓它處理待辦事項清單,讓您專注於需要資深判斷力的工作。具有清晰脈絡、能自主執行範圍明確任務的 AI 軟體工程師,是力量的倍增器。