01
多 Agent 系統的可視化 IDE
先前在 Hacker News 上看到一個名為 Rowboat 的專案,號稱是多 Agent 系統的 Cursor。
看了一下,還蠻有意思的。
Rowboat 是 YC 孵化的開源專案,目前累積 1.2 萬顆 Star。
簡單說,這是用來建置多 Agent 系統的可視化 IDE,還內建 Copilot 協助生成 Agent。
你不需要自己撰寫任何程式碼,只要輸入自然語言描述,Copilot 就會幫你把多 Agent 工作流程建置起來。
建置完成後還能在 AI 模擬場景中測試,確認沒問題再接入 MCP server 和各種工具。
底層採用 OpenAI 的 Agents SDK,已對接 Slack、Linear、Jira、GitHub、ElevenLabs、Exa 等常用服務。
可透過 Python SDK 和 HTTP API 兩種方式整合到你的產品中。
如果你想打造 AI 客服、自動化研究或內部工作流程,又不想從零開始鑽研多 Agent 框架,這個專案能幫你省下不少時間。
開源地址:https://github.com/rowboatlabs/rowboat
02
把編程 Agent 變成真正的隊友
Multica 的構想蠻有意思的,是 Linear 加上 AI Agent 的組合。
現在使用 Claude Code、Codex 等編碼 Agent,大多是在終端機裡一輪一輪複製貼上提示詞,完成一個任務後還得盯著。
Multica 想改變這種模式。
它把 Agent 變成了團隊成員,你可以像指派任務給同事一樣在看板上分配任務,Agent 會自行執行、回報進度、更新狀態,遇到問題還能回報 blocker。
目前已獲得 1.47 萬顆 Star,4 月份剛更新。
核心能力包括任務全生命週期管理、WebSocket 即時進度串流、每個 workspace 獨立隔離,支援本地 daemon 和雲端 runtime 混合使用。
相容 Claude Code、Codex、OpenCode、Gemini、Cursor Agent 等眾多 CLI。
而且解決方案會自動累積成可複用的 skill,團隊能力會隨著使用越來越強。
如果你的團隊已經開始用 AI Agent 撰寫程式碼,這個專案能讓協作井然有序。
開源地址:https://github.com/multica-ai/multica
03
AI 編碼工程紀律包
這個專案作者是 Addy Osmani,Google Chrome 團隊的工程主管,曾撰寫《Learning JavaScript Design Patterns》一書的大師。
Agent Skills 做的事情很直接,將資深工程師的開發規範封裝成 AI 可以直接執行的 skill。
目前累積 1.66 萬顆 Star。
核心是由 7 個 Skill 貫穿全流程:/spec 先撰寫需求、/plan 拆解任務、/build 增量實現、/test 驗證、/review 品質控管、/code-simplify 簡化、/ship 部署。
裡面包裝了 20 個 skill,按階段分得很清楚。
基本涵蓋了從定義需求到上線的完整生命週期。
AI 寫程式碼容易走捷徑跳過規範,這個專案就是把大型企業工程師的那套紀律強制導入給 Agent。
如果你使用 Claude Code 或類似工具進行實際專案,這套 skill 能顯著提升交付品質。
開源地址:https://github.com/addyosmani/agent-skills
04
讓 AI 編程可重複的工作流引擎
Archon 是 coleam00 開源的專案,定位為 AI 編程的 harness builder,目前累積 1.84 萬顆 Star。
它要解決的問題挺棘手的。
現在 AI 編程 Agent 執行起來,每次結果都不一樣,同樣一個任務今天跳過了 plan 階段,明天忘了寫測試,後天又無視了 PR 模板。
Archon 做的事情就是用 YAML 把流程固定下來,讓 AI 編碼變得確定且可重複。
幾個設計挺講究的。
每次工作流程執行都會開啟一個獨立的 git worktree,多個任務平行執行也不會互相污染。
節點是可組合的,確定性的 bash 指令碼、測試和 AI 的規劃、程式碼生成節點都能放進去。
內建 17 個預設工作流程,功能開發、問題修復、PR 審查、重構都有模板。
它也不只是命令列工具,CLI、Web UI、Slack、Telegram、Discord、GitHub 都能觸發。
團隊只要把 .archon/workflows/ 目錄下的 YAML 檔案提交到儲存庫,所有人使用的流程就會一致。
有點像 n8n 在通用自動化中的角色,Archon 想在 AI 編碼這件事上扮演類似的角色。
開源地址:https://github.com/coleam00/Archon
05
港大開源的 AI 家教
DeepTutor 是香港大學 Data Intelligence Lab 開源的 AI 學習助理,目前已獲得 1.88 萬顆 Star。
它有 5 大學習模式:
具備工具增強的對話(RAG + 連網 + 程式碼執行)、多 Agent 拆解複雜問題的 Deep Solve、基於知識庫自動出題的 Quiz Generation。
還有平行 Agent 深度研究的 Deep Research、專做數學視覺化的 Math Animator。
最有意思的是它做了一個叫做 TutorBot 的東西,每個 TutorBot 有獨立工作區和角色設定,可以自主運行,比那種簡單的聊天機器人高好幾個檔次。
還有 Co-Writer 這個 Markdown 編輯器把 AI 視為第一等公民,Persistent Memory 讓學習者畫像在所有功能中共享。
開源地址:https://github.com/HKUDS/DeepTutor
06
讓 Claude Code 變聰明的 CLAUDE.md
這個專案看了一下,感覺挺厲害的。
andrej-karpathy-skills 的核心就是一個 CLAUDE.md 檔案,靈感來自 Karpathy 在推特上吐槽大型模型寫程式碼的幾個問題,目前已狂攬 5 萬顆 Star。
Karpathy 當時吐槽了什麼?
模型做了錯誤假設不澄清就硬著頭皮繼續寫、程式碼和 API 過度設計搞出一堆沒用的抽象、順手修改了它沒完全理解的程式碼、困惑了也不說出來就裝懂繼續。
作者把這些觀察轉化成 4 條原則:
思考再寫:明確假設,必要時回報、簡潔優先:只寫必要程式碼,別搞推測性功能、手術式修改:只碰必要程式碼,符合現有風格、目標驅動執行:先定驗證標準再執行。
安裝有兩種方式,推薦使用 plugin:
/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills
也能直接把 CLAUDE.md 下載到專案根目錄使用。
如果你覺得 Claude Code 最近寫程式碼有點自作主張,試試這個檔案,會聽話很多。
開源地址:https://github.com/forrestchang/andrej-karpathy-skills
07
給 Claude Code 裝上長期記憶
claude-mem 解決的是 Claude Code 每次開啟新對話就失憶的問題,目前已達 6 萬顆 Star。
它的運作原理非常直接,對話進行時自動捕捉 Claude 做的所有事情,使用 Claude 的 agent-sdk 做 AI 語義壓縮,等下次啟動新對話再把相關上下文注入回去。
你不需要手動記錄,不需要手動召回,整個過程是自動的。
功能上還蠻完整的。
檢索使用的是 skill-based 自然語言搜尋,還做了漸進式揭露,每層記憶呼叫的 Token 成本都標示出來了,不會默默消耗你的 API 費用。
內建一個本地 Web Viewer 在 localhost:37777 執行,用瀏覽器可以直接查看歷史紀錄。
隱私方面,你可以用 <private> 標籤框住不想被記住的內容。
底層儲存是 SQLite 加上 Chroma 向量資料庫,都是本地的。
順帶也支援 Gemini CLI。
安裝一行指令就搞定:
npx claude-mem install
如果你每天和 Claude Code 打交道,這個工具幾乎是必需品。安裝完成後那種延續上次的感覺,挺舒服的。
開源地址:https://github.com/thedotmack/claude-mem
08
中國教材 PDF 全套打包
ChinaTextbook 這個專案挺紮實的,把國小、國中、高中、大學的教材 PDF 都收錄了,目前累積 6.97 萬顆 Star。
作者的動機寫得很直白,想推動義務教育資源平權,讓沒有資源的家庭也能取得正版教材,也方便海外華人家庭讓孩子接觸中文教育資源。
內容涵蓋人教版、五·四學制等多種課綱,數學部分從一年級一直到大學,特別齊全。
所有檔案都是 PDF,完全免費。
部分超過 50MB 的檔案被切成 35MB 一段,儲存庫裡提供了合併工具。
README 裡還特別說了一段,專案作者點名了那些把公開資源拿去二次販售的轉賣者,算是直接表明立場了。
如果你家有孩子需要輔導功課,或者你自己想補一些基礎知識,Clone 一下這個儲存庫可以用很久。
開源地址:https://github.com/TapXWorld/ChinaTextbook
09
萬物轉 Markdown 神器
這個專案如果你在做 AI 應用或者 RAG 流程,基本上無法迴避。
MarkItDown 是微軟官方推出的 Python 工具,目前累積 11.1 萬顆 Star,絕對是頂尖專案。
做的事情很簡單,把各種格式的檔案轉成 Markdown。
支援的格式一大串:PDF、Word、PPT、Excel、圖片、音訊、HTML 等等,甚至連 YouTube 連結都能直接拖進去。
為什麼要轉成 Markdown 呢?
因為現在的 LLM 對 Markdown 是原生友善,Token 使用率最高,結構也能完整保留下來,標題、清單、表格、連結都在。
幾個實用的特點:內建 LLM 整合,圖片可以呼叫 OpenAI 模型做描述,音訊能轉錄。有 Azure 文件智慧的對接,也支援第三方套件擴充,例如 markitdown-ocr。
安裝一行搞定:
pip install 'markitdown[all]'
命令列和 Python API 都能使用:
markitdown path-to-file.pdf -o document.md
不管是給 Claude、GPT 餵文件,做知識庫,還是做資料清洗,這個工具都應該放進常用工具箱。
開源地址:https://github.com/microsoft/markitdown
10
終端裝置跑得動的 TTS 大模型
VoxCPM 是面壁智慧開源的一個語音合成大型模型,上線沒多久就已經獲得 1.38 萬顆 Star。
簡單說,這是一個 2B 參數的 TTS 模型,訓練資料使用了 200 多萬小時的多語種語音,支援 30 種語言自動識別切換,輸出的音訊是 48kHz 錄音室等級。
它有兩個功能還挺厲害的。
一個是 Voice Design,你給一段文字描述,它能直接生成一個符合描述的音色,不需要提供參考音訊。
另一個是可控制聲音複製,複製完之後還能加上風格引導,讓同一個聲音表現出不同情緒。
即時串流推論方面,一張 RTX 4090 上 RTF 能跑到 0.3 左右,基本上算終端裝置可用了。
如果你在做 Podcast、影片配音、智慧客服或者有聲書,這個模型可以 Pull 下來試試。