マルチエージェントのオーケストレーションは煩雑すぎる?MASFactory が Vibe Graphing で「対話」から直接生成

こんにちは、PaperAgent です。エージェントではありません!

大規模言語モデル(LLM)の能力が飛躍的に向上する中、マルチエージェントシステム(MAS)は、極めて困難なタスクに対処するための重要な柱となっています。しかし、現在のMAS オーケストレーション分野を俯瞰すると、開発者は依然として時代遅れの構築手法に苦しめられています。高価なエンジニアリングコストを投じて複雑な通信ロジックを手動でハードコーディングするか、ドラッグ&ドロップ型のキャンバスフレームワークに妥協するかの二者択一です。しかし、複雑なマルチエージェントシステムの開発において、これらは作業量が膨大であり、Vibe Coding のように AI に人間の仕事を代替させることも困難です。

マルチエージェントシステム開発の現状と課題を示すイメージ図

この非効率なオーケストレーション手法を打破するため、北京郵電大学は新たなフレームワーク「MASFactory」を正式にオープンソース化しました。同フレームワークは、マルチエージェントのワークフローを記述するためにグラフ中心(Graph-Centric)のアーキテクチャを提案し、「Vibe Graphing」という開発パラダイムを導入。これにより、MAS の開発を手作業の組み立てから、自然言語で駆動する時代へと押し上げました。

Vibe Graphing とは

Vibe Graphing の概念図

「ハードコーディング」から「意図駆動」へ。従来のノード接続や低レベルロジックの記述とは異なり、MASFactory は「まず全体像の意図ありき、その後に局所的な詳細」というアプローチを提唱します。開発者は自然言語でシステムの最終目標と役割分担の希望を述べるだけで、内蔵の AI エンジンが実行可能なコラボレーショングラフ構造を瞬時に推論・生成します。

AI 生成プロセスにおいて懸念される「幻覚(ハルシネーション)の制御不能」な問題に対し、MASFactory は「Human-In-the-Loop(人間をループ内に含める)」プロセスを導入しています。開発者は各ステージの終了前に AI の提案するスキームを審査し、納得いくまで修正指示を出すことが可能です。

マルチエージェントオーケストレーションフレームワーク徹底比較

主要なマルチエージェントオーケストレーション手法の比較表

マルチエージェントシステムの開発進化の観点から、現在の主流手法は大きく 3 つに分類できます。コード記述、可視化ドラッグ&ドロップ、そして Vibe Graphing です。

コード記述方式は、最も高い柔軟性と拡張性を備えており、複雑かつ多層的なマルチエージェント協調システムの構築に適していますが、開発者に高度なスキルを求め、全体のコストも大きくなります。

一方、可視化ドラッグ&ドロップ方式は利用のハードルを大幅に下げ、より多くのユーザーが基礎的なワークフローを迅速に構築できる利点がありますが、複雑なトポロジ、きめ細かい制御、その後のイテレーションにおいては限界があります。

これに対し、Vibe Graphing はマルチエージェントシステムの設計を「手作業による実装」から「意図駆動型の生成」へとさらに進化させました。ユーザーは大量のコード記述やノードの繰り返し操作を必要とせず、明確にニーズを記述し、対話を通じて設計を洗練させるだけで、システムの構築と反復を迅速に行えます。そのため、複雑な要件に対する迅速なプロトタイピングや、人的コストを抑えた開発に特に適しています。

MASFactory のシステムアーキテクチャ

MASFactory の 4 層からなるシステムアーキテクチャ図

MASFactory は、複雑多岐にわたるマルチエージェントの相互作用を、科学的に 4 つのレイヤーへ抽象化しています。

  • グラフスケルトン層:他のマルチエージェントワークフローフレームワークと同様、Node(ノード)と Edge(エッジ)を基盤となる骨格とし、エージェント間の協調とメッセージの流れを記述します。
  • コンポーネント層:基盤骨格をですぐに使えるモジュールとしてパッケージ化しています。タスクを実行する Agent に加え、動的ルーティングを行う Switch、多段階の駆け引きを処理する Loop、そして Human-In-the-Loop のための Human ノードなどを導入。さらに重要なのは、あらゆる Graph をサブノードとして無限にネスト可能であり、ロジックの極限までの再利用を実現している点です。
  • 統一プロトコル層:アダプターメカニズムを活用し、異なる通信プロトコル間の差異をシームレスに解消。コンテキスト環境を一元的に管理し、RAG や Memory などの拡張機能を容易に接続できます。
  • ハイブリッド対話層:上流アプリケーションに対し、極めて柔軟な操作インターフェースを提供します。コード開発に親和性の高い宣言型・命令型オーケストレーション層、可視化ドラッグ&ドロップ層、Vibe Graphing 層を備え、多様な開発者の利用習慣に適合しています。

効果の比較検証

MASFactory の有効性を体系的に評価するため、論文では 2 つの側面から実験的検証を行いました。

  • 1 つ目は、既存の代表的なマルチエージェントシステムを MASFactory で再現する能力の検証です。
  • 2 つ目は、Vibe Graphing が生成するワークフローの実効性の検証です。実験では、コード生成タスク向けの HumanEval、MBPP、BigCodeBench、SRDD、そして汎用的な推論およびツール使用向けの MMLU-Pro、GAIA、GPQA を含む 7 つの公開ベンチマークを網羅しました。
7 つの公開ベンチマークにおける各手法のパフォーマンス比較グラフ

全体的に見て、7 つの公開ベンチマークにおける MASFactory の結果は、多様なマルチエージェントワークフローを安定的に支える能力を有していることを示すと同時に、「自然言語による意図→編集可能な仕様→実行可能なグラフ」というアプローチの実現可能性を証明するものでした。

同時に、Vibe Graphing によって生成されたワークフローも強力な競争力を示しています。ChatDev をベースに改造された「Vibe Graphing-ChatDev」も、タスク指向で直接生成された「Vibe Graphing-Task Specific」も、複数のベンチマークで好結果を残しました。特に Task Specific 方式は、HumanEval、BigCodeBench、SRDD において顕著な成果を上げており、自然言語駆動によるワークフロー生成が、人手による設計に匹敵、あるいはそれを凌駕するレベルに達しつつあることを示唆しています。

- **コードリポジトリ:** https://github.com/BUPT-GAMMA/MASFactory
- **論文 URL:** https://arxiv.org/abs/2603.06007

関連記事:

AI エージェントを設計する:オーケストレーション、メモリ、プラグイン、ワークフロー、協調

Claude Skills に関する最新論文 2 篇を共有、3 つの核心的結論あり

学習するロブスターこそが良いロブスター:OpenClaw-RL

2026 年、Agentic AI を語る上で避けて通れない 2 つの年頭総説


分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.