大家好,我是 PaperAgent,不是 Agent!
在大模型能力不斷躍升的當下,多智能體系統(MAS)已成為應對極具挑戰性任務的關鍵支柱。然而,審視當前的MAS 編排領域,開發者仍受困於陳舊的構建手段:要麼投入高昂的工程成本,用硬編碼手動維護複雜的通信邏輯;要麼妥協於拖曳式畫布框架,對於開發複雜的多智能體系統,工作量大且難以像 Vibe Coding 那樣接入 AI 替代人類工作。
為打破這種低效的編排方式,北京郵電大學正式開源了全新框架 MASFactory。該框架提出以圖為中心(Graph-Centric)的架構來描述多智能體工作流,並引入了「Vibe Graphing」開發範式,將 MAS 的開發從手工組裝推向了自然語言驅動的時代。
Vibe Graphing
從「硬編碼」到「意圖驅動」的 Vibe Graphing與傳統的節點連線或編寫底層邏輯不同,MASFactory 主張「先有全侷意圖,後有局部細節」。開發者只需用自然語言闡述系統的最終目標與角色分工期望,內建的 AI 引擎便會迅速推演出一套具備可行性的協作圖結構。
針對 AI 生成過程中可能存在的幻覺不可控的問題,MASFactory 引入「人在迴路(Human-In-the-Loop)」的過程。開發者可以在每個階段結束前審查 AI 的方案,並提出修改意見,直到 AI 的方案能夠讓開發者滿意。
多智能體編排框架大橫評
從多智能體系統的開發演進來看,當前主流方式大致可以分為三類:代碼編寫、可視化拖曳和 Vibe Graphing。
代碼編寫方式具備最高的靈活性和擴充套件性,適合構建複雜、多層次多智能體協作系統,但對開發者能力要求較高,整體開發成本也更大;
可視化拖曳則顯著降低了使用門檻,讓更多使用者能夠快速搭建基礎工作流,但在複雜拓撲、細粒度控制和後續迭代方面仍存在限制。
相比之下,Vibe Graphing 進一步將多智能體系統設計從「手工實現」推進到「意圖驅動生成」,使用者無需編寫大量代碼或反覆拖曳節點,只需清晰描述需求,並在互動過程中持續細化設計,即可快速完成系統構建與迭代。也正因此,Vibe Graphing 更適合面向複雜需求下的快速原型設計和低人力成本開發。
MASFactory 系統架構
MASFactory 將龐雜的多智能體互動科學地抽象為四個層次:
圖骨架層:像其他多智能體工作流框架一樣,將 Node(節點)與 Edge(邊)作為底層基礎骨架,刻畫智能體之間的協作與訊息流動。 元件層:將基礎骨架封裝為開箱即用的模組,不僅包含執行任務的 Agent,還引入了用於動態路由的 Switch、處理多輪博弈的 Loop,以及人在迴路的 Human 節點。更重要的是,任何 Graph 都可以作為子節點被無限嵌套,實現邏輯的極致複用。 統一協議層:藉助配適器機制,無縫抹平不同通信協議的差異,並統一管理上下文環境,輕鬆接入 RAG、Memory 等增強能力。 混合互動層:為上層應用提供極其靈活的操作入口,包括相容代碼開發的宣告式、命令式編排層、可視化的拖曳編排層和 Vibe Graphing 編排層,相容不同開發者的使用習慣。
效果對比
為系統評估 MASFactory 的有效性,論文從兩個層面進行了實驗驗證:
其一,檢驗 MASFactory 對已有代表性多智能體系統的複現能力;
其二,驗證 Vibe Graphing 所生成工作流的實際效果。實驗共覆蓋 7 個公開基準,包括面向代碼任務的 HumanEval、MBPP、BigCodeBench 和 SRDD,以及面向通用推理與工具使用的 MMLU-Pro、GAIA 和 GPQA。
整體來看,MASFactory 在 7 個公開基準上的結果表明,它既能較穩定地承載不同型別的多智能體工作流,也證明了「自然語言意圖—可編輯規約—可執行圖」這一路徑是可行的。
同時,Vibe Graphing 生成的工作流也展現出較強競爭力。無論是基於 ChatDev 改造得到的 Vibe Graphing-ChatDev,還是直接面向任務生成的 Vibe Graphing-Task Specific,都在多個基準上取得了可觀結果。其中,Task Specific 方案在 HumanEval、BigCodeBench 和 SRDD 上表現突出,說明透過自然語言驅動工作流生成,已經能夠接近甚至達到人工設計系統的效果。
相關資源連結:
動手設計 AI Agents:(編排、記憶、外掛、workflow、協作)