
QWEN STUDIO HUGGING FACE MODELSCOPE DISCORD
Qwen3.6-Plus のリリースに続き、総パラメータ数 350 億、アクティブパラメータ数 30 億という、スパースでありながら驚異的な能力を発揮する混合エキスパート(MoE)モデルQwen3.6-35B-A3Bをオープンソースとして公開できることを嬉しく思います。その効率性の高さと裏腹に、Qwen3.6-35B-A3B は卓越したエージェント型コーディング性能を発揮し、前身である Qwen3.5-35B-A3B を大きく凌駕するだけでなく、Qwen3.5-27B や Gemma4-31B といった遥かに大規模な密なモデルとも互角に渡り合います。マルチモーダル思考モードと非思考モードの両方に対応し、Qwen3.6-35B-A3B は現在利用可能な最も汎用性の高いオープンソースモデルの一つです。現在、Qwen3.6-35B-A3B は Qwen Studio で利用可能であり、API 経由での提供、ならびにコミュニティ向けの重み(Open Weights)の公開が開始されました。
- Qwen3.6-35B-A3B は完全オープンソースの MoE モデル(総計 35B / アクティブ 3B)であり、以下を特徴とします:
- 遥かに大規模なモデルと競合する、卓越したエージェント型コーディング能力
- 強力なマルチモーダル知覚および推論能力
- Qwen Studio で対話的にチャットしたり、Alibaba Cloud Model Studio API(近日公開)経由で
Qwen3.6-Flashとして API 呼び出しを行ったり、Hugging Face や ModelScope から重みをダウンロードしてご利用いただけます。

パフォーマンス#
以下では、Qwen3.6-35B-A3B と同規模のモデルを、広範なタスクおよびモダリティにわたって包括的に評価した結果を示します。
言語#
わずか 30 億のアクティブパラメータで動作する Qwen3.6-35B-A3B は、主要なコーディングベンチマークのいくつかにおいて、密構造の 270 億パラメータモデルである Qwen3.5-27B を上回り、特にエージェント型コーディングや推論タスクにおいては、直接の前身である Qwen3.5-35B-A3B を劇的に凌駕します。
| Qwen3.5-27B | Gemma4-31B | Qwen3.5-35BA3B | Gemma4-26BA4B | Qwen3.6-35BA3B | |
|---|---|---|---|---|---|
| コーディングエージェント | |||||
| SWE-bench Verified | 75.0 | 52.0 | 70.0 | 17.4 | 73.4 |
| SWE-bench Multilingual | 69.3 | 51.7 | 60.3 | 17.3 | 67.2 |
| SWE-bench Pro | 51.2 | 35.7 | 44.6 | 13.8 | 49.5 |
| Terminal-Bench 2.0 | 41.6 | 42.9 | 40.5 | 34.2 | 51.5 |
| Claw-Eval 平均 | 64.3 | 48.5 | 65.4 | 58.8 | 68.7 |
| Claw-Eval Pass^3 | 46.2 | 25.0 | 51.0 | 28.0 | 50.0 |
| SkillsBench Avg5 | 27.2 | 23.6 | 4.4 | 12.3 | 28.7 |
| QwenClawBench | 52.2 | 41.7 | 47.7 | 38.7 | 52.6 |
| NL2Repo | 27.3 | 15.5 | 20.5 | 11.6 | 29.4 |
| QwenWebBench | 1068 | 1197 | 978 | 1178 | 1397 |
| 汎用エージェント | |||||
| TAU3-Bench | 68.4 | 67.5 | 68.9 | 59.0 | 67.2 |
| VITA-Bench | 41.8 | 43.0 | 29.1 | 36.9 | 35.6 |
| DeepPlanning | 22.6 | 24.0 | 22.8 | 16.2 | 25.9 |
| Tool Decathlon | 31.5 | 21.2 | 28.7 | 12.0 | 26.9 |
| MCPMark | 36.3 | 18.1 | 27.0 | 14.2 | 37.0 |
| MCP-Atlas | 68.4 | 57.2 | 62.4 | 50.0 | 62.8 |
| WideSearch | 66.4 | 35.2 | 59.1 | 38.3 | 60.1 |
| 知識 | |||||
| MMLU-Pro | 86.1 | 85.2 | 85.3 | 82.6 | 85.2 |
| MMLU-Redux | 93.2 | 93.7 | 93.3 | 92.7 | 93.3 |
| SuperGPQA | 65.6 | 65.7 | 63.4 | 61.4 | 64.7 |
| C-Eval | 90.5 | 82.6 | 90.2 | 82.5 | 90.0 |
| STEM & 推論 | |||||
| GPQA | 85.5 | 84.3 | 84.2 | 82.3 | 86.0 |
| HLE | 24.3 | 19.5 | 22.4 | 8.7 | 21.4 |
| LiveCodeBench v6 | 80.7 | 80.0 | 74.6 | 77.1 | 80.4 |
| HMMT Feb 25 | 92.0 | 88.7 | 89.0 | 91.7 | 90.7 |
| HMMT Nov 25 | 89.8 | 87.5 | 89.2 | 87.5 | 89.1 |
| HMMT Feb 26 | 84.3 | 77.2 | 78.7 | 79.0 | 83.6 |
| IMOAnswerBench | 79.9 | 74.5 | 76.8 | 74.3 | 78.9 |
| AIME26 | 92.6 | 89.2 | 91.0 | 88.3 | 92.7 |
* SWE-Bench シリーズ:内部エージェントスキャフォールド(bash + ファイル編集ツール)。temp=1.0, top_p=0.95、200K コンテキストウィンドウ。SWE-bench Pro の公開セットにある問題のあるタスクをいくつか修正し、洗練されたベンチマークですべてのベースラインを評価しました。
* Terminal-Bench 2.0: Harbor/Terminus-2 ハーネス。3 時間タイムアウト、32 CPU/48 GB RAM。temp=1.0, top_p=0.95, top_k=20, max_tokens=80K、256K コンテキスト。5 回の実行の平均値。
* SkillsBench: OpenCode を介して 78 タスク(API 依存タスクを除く自己完結型サブセット)で評価。5 回の実行の平均値。
* NL2Repo: その他は Claude Code(temp=1.0, top_p=0.95, max_turns=900)を介して評価。
* QwenClawBench: 内部の実際のユーザー分布に基づく Claw エージェントベンチマーク(近日公開予定)。temp=0.6、256K コンテキスト。
* QwenWebBench: 内部のフロントエンドコード生成ベンチマーク。2 言語(英語/中国語)、7 カテゴリ(Web デザイン、Web アプリ、ゲーム、SVG、データ可視化、アニメーション、3D)。自動レンダリング + マルチモーダル判定(コード/視覚的正しさ)。BT/Elo レーティングシステム。
* TAU3-Bench: 公式ユーザーモデル(gpt-5.2、推論努力度低)+ デフォルトの BM25 検索を使用。
* VITA-Bench: 平均サブドメインスコア。公式判定者(claude-3.7-sonnet)が利用できなくなったため、判定者として claude-4-sonnet を使用。
* MCPMark: GitHub MCP v0.30.3。Playwright の応答は 32K トークンで切り捨て。
* MCP-Atlas: 公開セットのスコア。判定者は gemini-2.5-pro。
* AIME 26: 完全な AIME 2026(I & II)を使用。スコアは Qwen 3.5 の注記と異なる場合があります。
ビジョン・ランゲージ#
Qwen3.6 はネイティブにマルチモーダルであり、Qwen3.6-35B-A3B は、わずか 30 億程度のアクティブパラメータでありながら、そのサイズからは想像もつかないほどの知覚およびマルチモーダル推論能力を示しています。ほとんどのビジョン・ランゲージベンチマークにおいて、そのパフォーマンスは Claude Sonnet 4.5 と同等か、いくつかのタスクではそれを凌駕しています。その強さは空間知能において特に顕著であり、RefCOCO で 92.0、ODInW13 で 50.8 を達成しています。
| Qwen3.5-27B | Claude-Sonnet-4.5 | Gemma4-31B | Gemma4-26BA4B | Qwen3.5-35B-A3B | Qwen3.6-35B-A3B | |
|---|---|---|---|---|---|---|
| STEM およびパズル | ||||||
| MMMU | 82.3 | 79.6 | 80.4 | 78.4 | 81.4 | 81.7 |
| MMMU-Pro | 75.0 | 68.4 | 76.9* | 73.8* | 75.1 | 75.3 |
| Mathvista(mini) | 87.8 | 79.8 | 79.3 | 79.4 | 86.2 | 86.4 |
| ZEROBench_sub | 36.2 | 26.3 | 26.0 | 26.3 | 34.1 | 34.4 |
| 汎用 VQA | ||||||
| RealWorldQA | 83.7 | 70.3 | 72.3 | 72.2 | 84.1 | 85.3 |
| MMBenchEN-DEV-v1.1 | 92.6 | 88.3 | 90.9 | 89.0 | 91.5 | 92.8 |
| SimpleVQA | 56.0 | 57.6 | 52.9 | 52.2 | 58.3 | 58.9 |
| HallusionBench | 70.0 | 59.9 | 67.4 | 66.1 | 67.9 | 69.8 |
| テキスト認識およびドキュメント理解 | ||||||
| OmniDocBench1.5 | 88.9 | 85.8 | 80.1 | 74.4 | 89.3 | 89.9 |
| CharXiv(RQ) | 79.5 | 67.2 | 67.9 | 69.0 | 77.5 | 78.0 |
| CC-OCR | 81.0 | 68.1 | 75.7 | 74.5 | 80.7 | 81.9 |
| AI2D_TEST | 92.9 | 87.0 | 89.0 | 88.3 | 92.6 | 92.7 |
| 空間知能 | ||||||
| RefCOCO(avg) | 90.9 | -- | -- | -- | 89.2 | 92.0 |
| ODInW13 | 41.1 | -- | -- | -- | 42.6 | 50.8 |
| EmbSpatialBench | 84.5 | 71.8 | -- | -- | 83.1 | 84.3 |
| RefSpatialBench | 67.7 | -- | -- | -- | 63.5 | 64.3 |
| 動画理解 | ||||||
| VideoMME(字幕あり) | 87.0 | 81.1 | -- | -- | 86.6 | 86.6 |
| VideoMME(字幕なし) | 82.8 | 75.3 | -- | -- | 82.5 | 82.5 |
| VideoMMMU | 82.3 | 77.6 | 81.6 | 76.0 | 80.4 | 83.7 |
| MLVU | 85.9 | 72.8 | -- | -- | 85.6 | 86.2 |
| MVBench | 74.6 | -- | -- | -- | 74.8 | 74.6 |
| LVBench | 73.6 | -- | -- | -- | 71.4 | 71.4 |
* 空のセル(--)は、スコアが利用できないか、該当しないことを示します。
Qwen3.6-35B-A3B で構築する#
- Qwen3.6-35B-A3B は近日中に Alibaba Cloud Model Studio に登場します。完全な準備が整うまで、今しばらくお待ちください。
Qwen3.6-35B-A3B は、セルフホスティング向けに Hugging Face および ModelScope でオープンウェイトとして利用可能であり、また Alibaba Cloud Model Studio API 経由で qwen3.6-flash として利用できます。また、Qwen Studio で即座に試用することも可能です。
本モデルは、OpenClaw、Claude Code、Qwen Code などの人気のあるサードパーティ製コーディングアシスタントとシームレスに統合でき、開発ワークフローを効率化し、文脈を認識した効率的なコーディング体験を可能にします。
API の使用方法#
このリリースでは preserve_thinking 機能をサポートしています。これは、メッセージ内のそれ以前のすべてのターンからの思考内容を保持する機能であり、エージェントタスクに推奨されます。
Alibaba Cloud Model Studio#
Alibaba Cloud Model Studio は、OpenAI の仕様書に準拠したチャット補完およびレスポンス API を含む業界標準のプロトコル、ならびに Anthropic と互換性のある API インターフェースをサポートしています。
以下に、チャット補完 API のコード例を示します。
python""" 環境変数(公式ドキュメント参照): DASHSCOPE_API_KEY: https://modelstudio.console.alibabacloud.com の API キー DASHSCOPE_BASE_URL: (オプション) 互換モード API のベース URL。 - 北京: https://dashscope.aliyuncs.com/compatible-mode/v1 - シンガポール: https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - 米国 (バージニア): https://dashscope-us.aliyuncs.com/compatible-mode/v1 DASHSCOPE_MODEL: (オプション) モデル名。異なるモデルを使用する際に上書きします。 """from openai import OpenAIimport os
api_key = os.environ.get("DASHSCOPE_API_KEY")if not api_key: raise ValueError( "DASHSCOPE_API_KEY が必要です。" "export DASHSCOPE_API_KEY='your-api-key' として設定してください" )
client = OpenAI( api_key=api_key, base_url=os.environ.get( "DASHSCOPE_BASE_URL", "https://dashscope-intl.aliyuncs.com/compatible-mode/v1", ),)
messages = [{"role": "user", "content": "vibe coding について教えてください。"}]
model = os.environ.get( "DASHSCOPE_MODEL", "qwen3.6-flash",)completion = client.chat.completions.create( model=model, messages=messages, extra_body={ "enable_thinking": True, # "preserve_thinking": True, }, stream=True)
reasoning_content = "" # 完全な推論トレースanswer_content = "" # 完全なレスポンスis_answering = False # 回答フェーズに入ったかどうかprint("\n" + "=" * 20 + "推論" + "=" * 20 + "\n")
for chunk in completion: if not chunk.choices: print("\n使用量:") print(chunk.usage) continue
delta = chunk.choices[0].delta
# 推論コンテンツのみを収集 if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None: if not is_answering: print(delta.reasoning_content, end="", flush=True) reasoning_content += delta.reasoning_content
# コンテンツを受信、回答フェーズを開始 if hasattr(delta, "content") and delta.content: if not is_answering: print("\n" + "=" * 20 + "回答" + "=" * 20 + "\n") is_answering = True print(delta.content, end="", flush=True) answer_content += delta.content詳細については、API ドキュメントをご覧ください。
コーディング & エージェント#
Qwen3.6-35B-A3B は優れたエージェント型コーディング機能を備えており、OpenClaw、Claude Code、Qwen Code などの人気のあるサードパーティ製コーディングアシスタントとシームレスに統合できます。
OpenClaw#
Qwen3.6-35B-A3B は、セルフホスト型のオープンソース AI コーディングエージェントである OpenClaw(旧 Moltbot / Clawdbot)と互換性があります。これを Model Studio に接続することで、ターミナルで完全なエージェント型コーディング体験を得ることができます。以下のスクリプトから始めてください。
bash# Node.js 22+curl -fsSL https://molt.bot/install.sh | bash # macOS / Linux
# API キーを設定export DASHSCOPE_API_KEY=<your_api_key>
# OpenClaw を起動openclaw dashboard # ウェブブラウザ# openclaw tui # 新しいターミナルを開き、TUI を開始初回使用時は、~/.openclaw/openclaw.json を編集して OpenClaw を Model Studio に向けます。以下のフィールドを見つけてマージしてください。既存の設定を保持するため、ファイル全体を上書きしないでください。
json{ "models": { "mode": "merge", "providers": { "modelstudio": { "baseUrl": "https://dashscope-intl.aliyuncs.com/compatible-mode/v1", "apiKey": "DASHSCOPE_API_KEY", "api": "openai-completions", "models": [ { "id": "qwen3.6-flash", "name": "qwen3.6-flash", "reasoning": true, "input": ["text", "image"], "contextWindow": 131072, "maxTokens": 16384 } ] } } }, "agents": { "defaults": { "model": { "primary": "modelstudio/qwen3.6-flash" }, "models": { "modelstudio/qwen3.6-flash": {} } } }}Qwen Code#
Qwen3.6-35B-A3B は、ターミナル向けに設計され、Qwen シリーズに深く最適化されたオープンソース AI エージェントである Qwen Code と互換性があります。以下のスクリプトから始めてください。
bash# Node.js 20+npm install -g @qwen-code/qwen-code@latest
# Qwen Code を開始(対話モード)qwen
# その後、セッション内で:/help /auth 初回使用時にログインを促すメッセージが表示されます。認証方法はいつでも /auth を実行して切り替えることができます。
Claude Code#
Qwen API は Anthropic API プロトコルもサポートしているため、Claude Code などのツールで使用して、さらに高度なコーディング体験を得ることができます。
bash# Claude Code をインストールnpm install -g @anthropic-ai/claude-code
# 環境を設定export ANTHROPIC_MODEL="qwen3.6-flash"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-flash"export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic export ANTHROPIC_AUTH_TOKEN=<your_api_key>
# CLI を起動claude 要約#
Qwen3.6-35B-A3B は、スパースな MoE モデルが驚異的なエージェント型コーディングおよび推論能力を達成しうることを実証しました。わずか 30 億のアクティブパラメータで、アクティブなサイズの何倍もの密なモデルに匹敵するパフォーマンスを提供し、マルチモーダルベンチマークでも卓越した成果を上げています。完全にオープンソースのチェックポイントとして、この規模で可能なことの新たな基準を打ち立てています。
今後、私たちは Qwen3.6 オープンソースファミリーを拡大し続け、効率的でオープンなモデルが達成しうる限界を押し広げていきます。コミュニティからのフィードバックに感謝し、皆様方が Qwen3.6-35B-A3B で何を構築してくださるのかを楽しみにしています。また、Qwen3.6 オープンソースファミリーは今後も拡大を続けますので、今後のリリースにもご期待ください。
引用#
Qwen3.6-35B-A3B が役立つとお感じになった場合は、以下の記事をご引用ください。
bibtex@misc{qwen36_35b_a3b, title = {{Qwen3.6-35B-A3B}: Agentic Coding Power, Now Open to All}, url = {https://qwen.ai/blog?id=qwen3.6-35b-a3b}, author = {{Qwen Team}}, month = {April}, year = {2026}}