GitHubで最新の注目リポジトリ:OpenSquilla。
ロブスターやHermesに続き、急速に注目を集めているエージェントで、すでに2000以上のスターを獲得しています。
ざっと見てみると、最大のセールスポイントは「スマートモデルルーティング」が内蔵されていることです。これにより、同じタスクでもトークンコストがロブスターと比べて60~80%も節約できます。
タスク実行中の見た目はこんな感じで、「スロットマシン」のようです。
とても爽快です。タスクが完了するとアニメーションが表示され、どれだけトークンを節約できたかが表示され、各段階のトークン消費量も追跡できます。
よく90%以上も節約され、急に財布が膨らんだ気分になります。
まさに最高の「守銭奴」(もちろん褒め言葉です)と言えるでしょう。
しかし、今回お話ししたいのはこれではありません。
彼らが発表したばかりの新機能、Meta Skillについてです。
あのMetaのことではなく、直訳すると「メタスキル」、つまりスキルを扱うスキルです。
一つのMeta Skillには複数のスキルが内包されており、これらをつなぎ合わせることで、エンドツーエンドで一連の長いワークフローを完遂する「スーパー白書」となります。
△画像はAI生成
Meta Skillを実地テスト
偶然ですが、先々週、私たちのAIGC産業サミットのバックエンド作業を自動化していた時、まさにこのアイデアが浮かびました。
ご存じないかもしれませんが、このようなカンファレンスの運営は非常に煩雑で、作業の流れは断片化しています。
以前作成したSOPによると、私の担当部分はおおむねこのような感じです。
一見すっきりしているように見えますが、これを自動化するとなると、図中のすべての青い四角は、対話ボックスで個別にスキルを呼び出す必要があることを意味します。
まるでヒキガエルをつつくように、一つ一つ指示を与える必要があり、ずっと人間の介入が必要です。スキルリストを探すだけでも手間がかかり、非常に面倒です。
そこで、ワークフローを固めた後、私はこの大量のコンテキストを一つの「スーパースキル」に錬成し、エンドツーエンド化しました。
コンテキストを受け取ると、現在どの段階にあるかを自動で判断し、対応するサブスキルを呼び出して結果を渡します。
さらに「ハートビートメカニズム」を追加して定期的にステータス文書を確認することで、完全に自動化して進行させられます。
しかし正直なところ、これほど大規模なスキルパッケージを作成するのは本当に面倒で、最終的な結果もかなり粗削りでした。
これは、私自身がコンテンツ業界にノウハウがあるという前提があってのことです。もし業界横断的な専門家の経験を統合する必要があるタスクなら、こんな風にスキルを組み合わせていくのは、まさに悪夢となるでしょう。
だから私はずっと、Claudeに内蔵されているスキルのように、あらかじめパッケージ化されたものがないかと熱心に探していました。
(待ちの姿勢で)
驚いたことに、一昨日GitHubでまさにそのようなリポジトリを見つけたのです!
9つのパッケージ化されたMeta Skillが、エージェントに内包されています。
実際に一つ試してみましょう。「meta-kid-project-planner」というものを選びます。
これは子供向けプロジェクト計画のためのMeta Skillで、子供が科学展示プロジェクト、趣味の工作、創造的な小発明などをしたいときに、ゼロから実行可能なプロジェクト計画を立てるのを支援します。
最近ちょうど端午の節句(子供の日)があったので、ぴったりだと思いました。手を抜くために、子供にMeta Skillを自習してもらい、この9つのSkillがそれぞれ何をするものかを皆さんに説明してもらうシナリオを設計しました。
プロンプトは以下の通りです。
9歳の子供がMeta Skill魔法書を作りたい。最初にウェブで表示してから紙の小さな本にする。各ページに1つの呪文を紹介する。
あまり詳細に書く必要はありません。正式に作業を始める前に、Skillの指示に従って、より多くの情報を提供するように求められます。
そして、ここからが「徹底的にワイルド」になる時間です。
とんでもないことに、一気にこれほど多くの実行トレースが吐き出され、要件が一連の長いサブタスクに分解されました。
全行程、人の介入を一切必要とせず、自律的に20分以上稼働し、最終的に完全な7日間のプロジェクト計画パッケージを納品しました。
確かに非常に至れり尽くせりで、子供向けであることを考慮して、追加で安全審査まで行っていました。
また、様々な予備案まで準備されていました。
どうやって実現しているのでしょうか?
このMeta SkillのSKILL.mdソースファイルを調べてみると、大まかな流れはこうなっています。
1. プロジェクト立ち上げ:ユーザーの好み、年齢、期間、予算、保護者の参加度を尋ねます。
2. 実現可能性の分類:安全かどうか、大人の助けが必要か、追加で購入が必要かを判断します。
3. 実行:段階的計画→材料リスト→安全注意事項→保護者の学習目標→最終的な組み立てと納品。
もし屋外活動が含まれる場合、天気を調べるためにウェブ検索まで呼び出します...
△画像はAI生成
このワークフロー全体は、5つの異なる原子スキルを組み合わせて作られています。
最終的な納品物は上記のプロジェクト計画パッケージ(md)で、約3000字程度です。
しかし見やすくするために、私はClaude Opus 4.7にこの文脈をもとにHTMLをでっち上げてもらいました。
インタラクションロジックは物理的な本と同様で、ページをめくるたびにアニメーションが表示されます。
計9つのMeta Skillで、すべて私の「ハリーポッター風」の指示に従って解説されています。
最後に「鏡よ鏡」機能もあり、子供がニーズに合わせてスキルを選びやすくなっています。
ウェブページはすでにデプロイされており、リンクは文末にあります。mdファイルを見たくない方は、こちらの形式でこの9つのMeta Skillを理解することができます。
そうそう、もう一つ重要なことがあります。
実地テストの結果、このSquillaルーティングは確かにお金の節約に大いに役立つと感じました。何でもかんでもClaudeに処理させるわけではありません。
例えば、このような他愛ない質問には、たったの0.03円しかかかりませんでした。
(追記:DeepSeekの値下げ後は本当にお得ですね!!)
このトークンコストのベンチマークを見ると、かなり衝撃的です。
もちろん、ルーティングを有効にするかどうかは自分で選択できますし、特定のモデルに固定するようプロンプトで直接要求することも可能です。
最後にインストール方法について説明します。
正直なところ、非常に簡単です。ロブスターをインストールしたことがあれば、ワンクリックでデータ資産やAPIキーを移行できます。
やや面倒なのは、Macではターミナル経由でインストールする必要があり、現在はWindowsのみ圧縮パッケージをサポートしている点です。
しかし、心配いりません。Mac/Linuxでは、以下のコードをターミナルに順番にコピー&ペーストするだけです。その後、何か問題があれば、すべてCodexに任せましょう。
# uvのインストール:
curl -LsSf https://astral.sh/uv/install.sh | sh
. "$HOME/.local/bin/env"
# OpenSquillaのインストール:
uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.0/opensquilla-0.3.0-py3-none-any.whl"
# 設定と実行:
opensquilla onboard
opensquilla gateway runこの画面が表示されれば、インストール成功です。
エントリーポイントとしては、主要なIMツール(Feishu、Discord、QQなど)をサポートしています。お好きなものをお選びください。
しかし、私は彼らのWeb版をお勧めします。理由は特にありませんが、「スマートルーティングのスロットマシン」や「トークン節約アニメーション」はWeb版でしか表示されないからです。。。
ターミナルやIMを使うと、楽しみがかなり減ってしまいます。
秘訣は何か?
ここまで読んで、疑問に思う人もいるでしょう。先ほどの20分間も実行されたプロジェクト計画パッケージでは、検索エンジンを呼び出したり、天気を調べたり、記憶を参照したり、安全審査をしたり…これらの作業は、一体誰が手配しているのでしょうか?
以前のエージェントは、一つのスキルで一つのこと、検索は検索、文書は文書、天気は天気という具合でした。あなた自身が手動でフローをつなぎ、次にどのスキルを使うかを頭の中に入れておかなければなりませんでした。
しかし今や、Meta Skillがこの「ディスパッチャー」の役割を引き継ぎます。
これを「プロジェクトマネージャーの運用マニュアル」と理解すると良いでしょう。どのステップを並列に、どのステップを直列に進めるか、どのステップの成果物を次のステップに渡すか…すべてがここに書かれています。
しかし、プロジェクトマネージャーだけでは不十分です。
仕事を割り振るだけのPMが、もしすべてのステップを最も高価な外注業者に依頼していたら、会社は長くは持ちません。
だからこそ、私はずっとスマートルーティングに注目してきたのです。それは本当に静かに多くのことを担っています。
先ほど見た「スロットマシン」は、このPMの予算管理を支援するものです。各サブステップを通過する際、ルーティングが財布のひもをしっかりと締めてくれます。
例えば先ほどのkid-project-plannerでは、子供の年齢や好みを抽出するような作業にはDeepSeekで十分です。安全審査の計画や14日間の計画を生成するようなステップだけが、より大規模なパラメータを持つモデルに割り当てられます。
最終的に、プロジェクトマネージャーも予算管理も手に入りました。しかし、まだ問題があります——
PMの運用マニュアルは、誰が書くのでしょうか?
Meta Skillは素晴らしいですが、肝心なのは、本当に複雑だということです!!
私の経験から言うと、先ほどのkid-project-plannerは400行以上のSKILL.mdがあり、AIと反復作業をしても約30分かかります。これもあなたの頭の中に明確なSOPが既に存在している前提での話です。
つまり、Meta Skillを作成するためのMeta Skill(非常にややこしいですね)も、非常に必要だということです。
それはmeta-skill-creatorと呼ばれ、今回OpenSquillaが発表した9つのSkillの中で最も重要なものだと私は考えています。
このmdをリポジトリで読むことをお勧めします。これを理解できれば、Meta Skill全体の動作原理を基本的に把握できます。
しかし、時間がない場合は、このAI生成の解説図を直接見ることもできます。
△画像はAI生成
この段階で、Meta Skillのすべての障壁は解決されました。
しかし、チームはさらに遠くのことを考えていました——
それは、需要と供給のマッチング問題です。
クリエイターが新しいMeta Skillを次々と生み出し、コミュニティも新しいものをどんどん提供し続けると、スキルの膨張問題をどう解決するのでしょうか?
現在、リポジトリには9個しかありませんが、将来数百のMeta Skillができた場合、どれが自分のシナリオに最適かをどうやって知るのでしょうか?
OpenSquillaが出した解決策は、「個人×コミュニティ」のインデックスプロトコルです。
あなたが普段どのスキルをよく使うか、どのような組み合わせ順序を好むか、どれが使いにくかったか…これらの情報がシグナルとして扱われ、エージェントがコミュニティ内の他の人が作成したスキルとマッチングし、あなたのワークフローに基づいて新しいものを縫い合わせます。
簡単に言うと、これは自動スキル推薦エンジンです。
Skill 2.0時代の到来
最後に、このリポジトリのバージョン履歴を詳しく見てみましょう。この視点は非常に興味深く、彼らの製品思考を解きほぐすように段階的に明らかにすることができます——
5月初旬、最初の一歩が踏み出され、スマートルーティングがリリースされました。当初は単なるトークン最適化のためのものだと思われていました。
その後、Meta Skillの登場により、この足跡はついに明確になり始め、ある反直感的な方向へと向かっています。
それは、3つのラインの交点に同時に立っているのです——
1. モデル。
複雑で多段階の指示を理解する能力はここ2年で急速に向上し、エージェントのトークンデータのフライホイールはすでに回り始めています。
モデルは複雑な編成指示を「理解できる」ようになりました。これがすべての前提です。
2. エコシステム。
コミュニティで作成されたスキルは爆発的に増加しています。
ユーザーによる手書きから、データに基づく自動生成、そしてコミュニティでの収集と共有へ…選択可能なスキルが何千とある場合、スキル選定のコストを削減するために、より高次の抽象レイヤー、つまりMeta Skillが必要になります。
3. コスト。
大規模言語モデルを大規模に実行するのは依然として高価です。エージェントにオンラインで試行錯誤させ、最適な経路を何度も模索させるたびに、大量のトークンが消費されます。
Meta Skillを通じて、この複雑さの層を直接固定化し、最適化問題をスキル層に前倒しすることができます。
そして、これら3つの痛点は、再び迫られているパラダイムシフトを同時に指し示しています。
それが、Skill 2.0です。
単一のスキルではもはや不十分であり、自動化がさらに深まるためには、複数のサブスキルを組み合わせることを学ばなければなりません。
エージェントが次に解決すべき問題は、「ツールを呼び出せるかどうか」から、「ツールを組織できるかどうか」へと変わりました。
しかし、別の角度から見ると、これは非常にエキサイティングでもあります——
複数のスキルが衝突したとき、どのような想像の余地を生み出すのでしょうか?
なにしろ、最近では多くのモデルが独自のエージェントチームを発表しています。TencentのMarvis、MiniMaxのMavis、Kimiのエージェントクラスタ…
しかし、スキル層はClaudeによって火がついたばかりの段階にまだ留まっており、コミュニティは基本的にまだ単一モデル向けのSkill.mdを作成している状態です。
だから私は、マルチエージェントの潜在能力は、実はまだ完全に解放されていないと考えています。
そして今回のMeta Skillの登場は、私に一つの可能性を見せてくれました——それは、エージェントチームのために設計された白書であり、モデルにより巨視的な全体コンテキストを付与するものです。
エージェントと人間は、直面する多くの核心的問題において、結局は同じ目的地に向かっているのです。
社員(エージェント)が増え、業務(スキル)が増えると、必然的に指数関数的に増幅されるノイズに遭遇します。
その時、いかにアーキテクチャとマネジメントを上手く使ってエントロピーを減少させるかが、非常に重要になります。
ようこそ、Meta Skillを開いてください。
これは、エージェントの三省六部を指導するための白書なのです。
OMT
おっと!ちょっと待って、まだブラウザを閉じないでください。
調査中に奇妙なことに気づきました——
これほど話題のプロジェクトなのに、公式アカウントがあるのはXのみで、しかも最初のバージョンがAK神によってリツイートされました。しかし、チームが誰なのかは全く分からず、かなり謎に包まれています。
噂によると中国のチームらしいので、さらに興味が湧きました。
AIで半日調査しましたが成果はなく、最終的には昔ながらの方法で方々に尋ねてみました。すると、思いがけず、王雲鶴(Wang Yunhe)氏の最新の起業動向がこうして明らかになりました。
OpenSquillaは、彼が設立した「基元律動(Primordial Rhythm)」という会社によるもので、チームは現在、積極的に人材を募集しています。
チームがまだ立ち上がったばかりで、製品の磨き込みに集中したいということでした。
もう少し様子を見ましょう。今後の展開に期待します。
GitHub:https://github.com/opensquilla/opensquilla
Skill魔法書:https://imtangyujing.github.io/opensquilla-meta-skill-grimoire/