Qwen3.6-35B-A3B: エージェント型コーディング能力を備えたスパース MoE モデルがオープンソース化

QWEN STUDIO HUGGING FACE MODELSCOPE DISCORD

Qwen3.6-Plus のリリースに続き、総パラメータ数 350 億、アクティブパラメータ数 30 億という、スパースでありながら驚異的な能力を発揮する混合エキスパート（MoE）モデルQwen3.6-35B-A3Bをオープンソースとして公開できることを嬉しく思います。その効率性の高さと裏腹に、Qwen3.6-35B-A3B は卓越したエージェント型コーディング性能を発揮し、前身である Qwen3.5-35B-A3B を大きく凌駕するだけでなく、Qwen3.5-27B や Gemma4-31B といった遥かに大規模な密なモデルとも互角に渡り合います。マルチモーダル思考モードと非思考モードの両方に対応し、Qwen3.6-35B-A3B は現在利用可能な最も汎用性の高いオープンソースモデルの一つです。現在、Qwen3.6-35B-A3B は Qwen Studio で利用可能であり、API 経由での提供、ならびにコミュニティ向けの重み（Open Weights）の公開が開始されました。

Qwen3.6-35B-A3B は完全オープンソースの MoE モデル（総計 35B / アクティブ 3B）であり、以下を特徴とします：
- 遥かに大規模なモデルと競合する、卓越したエージェント型コーディング能力
- 強力なマルチモーダル知覚および推論能力
Qwen Studio で対話的にチャットしたり、Alibaba Cloud Model Studio API（近日公開）経由でQwen3.6-Flashとして API 呼び出しを行ったり、Hugging Face や ModelScope から重みをダウンロードしてご利用いただけます。

パフォーマンス#

以下では、Qwen3.6-35B-A3B と同規模のモデルを、広範なタスクおよびモダリティにわたって包括的に評価した結果を示します。

言語#

わずか 30 億のアクティブパラメータで動作する Qwen3.6-35B-A3B は、主要なコーディングベンチマークのいくつかにおいて、密構造の 270 億パラメータモデルである Qwen3.5-27B を上回り、特にエージェント型コーディングや推論タスクにおいては、直接の前身である Qwen3.5-35B-A3B を劇的に凌駕します。

	Qwen3.5-27B	Gemma4-31B	Qwen3.5-35BA3B	Gemma4-26BA4B	Qwen3.6-35BA3B
コーディングエージェント
SWE-bench Verified	75.0	52.0	70.0	17.4	73.4
SWE-bench Multilingual	69.3	51.7	60.3	17.3	67.2
SWE-bench Pro	51.2	35.7	44.6	13.8	49.5
Terminal-Bench 2.0	41.6	42.9	40.5	34.2	51.5
Claw-Eval _平均	64.3	48.5	65.4	58.8	68.7
Claw-Eval _Pass^3	46.2	25.0	51.0	28.0	50.0
SkillsBench _Avg5	27.2	23.6	4.4	12.3	28.7
QwenClawBench	52.2	41.7	47.7	38.7	52.6
NL2Repo	27.3	15.5	20.5	11.6	29.4
QwenWebBench	1068	1197	978	1178	1397
汎用エージェント
TAU3-Bench	68.4	67.5	68.9	59.0	67.2
VITA-Bench	41.8	43.0	29.1	36.9	35.6
DeepPlanning	22.6	24.0	22.8	16.2	25.9
Tool Decathlon	31.5	21.2	28.7	12.0	26.9
MCPMark	36.3	18.1	27.0	14.2	37.0
MCP-Atlas	68.4	57.2	62.4	50.0	62.8
WideSearch	66.4	35.2	59.1	38.3	60.1
知識
MMLU-Pro	86.1	85.2	85.3	82.6	85.2
MMLU-Redux	93.2	93.7	93.3	92.7	93.3
SuperGPQA	65.6	65.7	63.4	61.4	64.7
C-Eval	90.5	82.6	90.2	82.5	90.0
STEM & 推論
GPQA	85.5	84.3	84.2	82.3	86.0
HLE	24.3	19.5	22.4	8.7	21.4
LiveCodeBench v6	80.7	80.0	74.6	77.1	80.4
HMMT Feb 25	92.0	88.7	89.0	91.7	90.7
HMMT Nov 25	89.8	87.5	89.2	87.5	89.1
HMMT Feb 26	84.3	77.2	78.7	79.0	83.6
IMOAnswerBench	79.9	74.5	76.8	74.3	78.9
AIME26	92.6	89.2	91.0	88.3	92.7

* SWE-Bench シリーズ：内部エージェントスキャフォールド（bash + ファイル編集ツール）。temp=1.0, top_p=0.95、200K コンテキストウィンドウ。SWE-bench Pro の公開セットにある問題のあるタスクをいくつか修正し、洗練されたベンチマークですべてのベースラインを評価しました。
* Terminal-Bench 2.0: Harbor/Terminus-2 ハーネス。3 時間タイムアウト、32 CPU/48 GB RAM。temp=1.0, top_p=0.95, top_k=20, max_tokens=80K、256K コンテキスト。5 回の実行の平均値。
* SkillsBench: OpenCode を介して 78 タスク（API 依存タスクを除く自己完結型サブセット）で評価。5 回の実行の平均値。
* NL2Repo: その他は Claude Code（temp=1.0, top_p=0.95, max_turns=900）を介して評価。
* QwenClawBench: 内部の実際のユーザー分布に基づく Claw エージェントベンチマーク（近日公開予定）。temp=0.6、256K コンテキスト。
* QwenWebBench: 内部のフロントエンドコード生成ベンチマーク。2 言語（英語/中国語）、7 カテゴリ（Web デザイン、Web アプリ、ゲーム、SVG、データ可視化、アニメーション、3D）。自動レンダリング + マルチモーダル判定（コード/視覚的正しさ）。BT/Elo レーティングシステム。
* TAU3-Bench: 公式ユーザーモデル（gpt-5.2、推論努力度低）+ デフォルトの BM25 検索を使用。
* VITA-Bench: 平均サブドメインスコア。公式判定者（claude-3.7-sonnet）が利用できなくなったため、判定者として claude-4-sonnet を使用。
* MCPMark: GitHub MCP v0.30.3。Playwright の応答は 32K トークンで切り捨て。
* MCP-Atlas: 公開セットのスコア。判定者は gemini-2.5-pro。
* AIME 26: 完全な AIME 2026（I & II）を使用。スコアは Qwen 3.5 の注記と異なる場合があります。

ビジョン・ランゲージ#

Qwen3.6 はネイティブにマルチモーダルであり、Qwen3.6-35B-A3B は、わずか 30 億程度のアクティブパラメータでありながら、そのサイズからは想像もつかないほどの知覚およびマルチモーダル推論能力を示しています。ほとんどのビジョン・ランゲージベンチマークにおいて、そのパフォーマンスは Claude Sonnet 4.5 と同等か、いくつかのタスクではそれを凌駕しています。その強さは空間知能において特に顕著であり、RefCOCO で 92.0、ODInW13 で 50.8 を達成しています。

	Qwen3.5-27B	Claude-Sonnet-4.5	Gemma4-31B	Gemma4-26BA4B	Qwen3.5-35B-A3B	Qwen3.6-35B-A3B
STEM およびパズル
MMMU	82.3	79.6	80.4	78.4	81.4	81.7
MMMU-Pro	75.0	68.4	76.9*	73.8*	75.1	75.3
Mathvista(mini)	87.8	79.8	79.3	79.4	86.2	86.4
ZEROBench_sub	36.2	26.3	26.0	26.3	34.1	34.4
汎用 VQA
RealWorldQA	83.7	70.3	72.3	72.2	84.1	85.3
MMBench_EN-DEV-v1.1	92.6	88.3	90.9	89.0	91.5	92.8
SimpleVQA	56.0	57.6	52.9	52.2	58.3	58.9
HallusionBench	70.0	59.9	67.4	66.1	67.9	69.8
テキスト認識およびドキュメント理解
OmniDocBench1.5	88.9	85.8	80.1	74.4	89.3	89.9
CharXiv(RQ)	79.5	67.2	67.9	69.0	77.5	78.0
CC-OCR	81.0	68.1	75.7	74.5	80.7	81.9
AI2D_TEST	92.9	87.0	89.0	88.3	92.6	92.7
空間知能
RefCOCO(avg)	90.9	--	--	--	89.2	92.0
ODInW13	41.1	--	--	--	42.6	50.8
EmbSpatialBench	84.5	71.8	--	--	83.1	84.3
RefSpatialBench	67.7	--	--	--	63.5	64.3
動画理解
VideoMME_{(字幕あり)}	87.0	81.1	--	--	86.6	86.6
VideoMME_{(字幕なし)}	82.8	75.3	--	--	82.5	82.5
VideoMMMU	82.3	77.6	81.6	76.0	80.4	83.7
MLVU	85.9	72.8	--	--	85.6	86.2
MVBench	74.6	--	--	--	74.8	74.6
LVBench	73.6	--	--	--	71.4	71.4

* 空のセル（--）は、スコアが利用できないか、該当しないことを示します。

Qwen3.6-35B-A3B で構築する#

Qwen3.6-35B-A3B は近日中に Alibaba Cloud Model Studio に登場します。完全な準備が整うまで、今しばらくお待ちください。

Qwen3.6-35B-A3B は、セルフホスティング向けに Hugging Face および ModelScope でオープンウェイトとして利用可能であり、また Alibaba Cloud Model Studio API 経由で qwen3.6-flash として利用できます。また、Qwen Studio で即座に試用することも可能です。

本モデルは、OpenClaw、Claude Code、Qwen Code などの人気のあるサードパーティ製コーディングアシスタントとシームレスに統合でき、開発ワークフローを効率化し、文脈を認識した効率的なコーディング体験を可能にします。

API の使用方法#

このリリースでは preserve_thinking 機能をサポートしています。これは、メッセージ内のそれ以前のすべてのターンからの思考内容を保持する機能であり、エージェントタスクに推奨されます。

Alibaba Cloud Model Studio#

Alibaba Cloud Model Studio は、OpenAI の仕様書に準拠したチャット補完およびレスポンス API を含む業界標準のプロトコル、ならびに Anthropic と互換性のある API インターフェースをサポートしています。

以下に、チャット補完 API のコード例を示します。

python
""" 環境変数（公式ドキュメント参照）:  DASHSCOPE_API_KEY: https://modelstudio.console.alibabacloud.com の API キー  DASHSCOPE_BASE_URL: (オプション) 互換モード API のベース URL。  - 北京: https://dashscope.aliyuncs.com/compatible-mode/v1  - シンガポール: https://dashscope-intl.aliyuncs.com/compatible-mode/v1  - 米国 (バージニア): https://dashscope-us.aliyuncs.com/compatible-mode/v1  DASHSCOPE_MODEL: (オプション) モデル名。異なるモデルを使用する際に上書きします。 """from openai import OpenAIimport os
api_key = os.environ.get("DASHSCOPE_API_KEY")if not api_key: raise ValueError( "DASHSCOPE_API_KEY が必要です。" "export DASHSCOPE_API_KEY='your-api-key' として設定してください" )
client = OpenAI( api_key=api_key, base_url=os.environ.get( "DASHSCOPE_BASE_URL", "https://dashscope-intl.aliyuncs.com/compatible-mode/v1", ),)
messages = [{"role": "user", "content": "vibe coding について教えてください。"}]
model = os.environ.get( "DASHSCOPE_MODEL", "qwen3.6-flash",)completion = client.chat.completions.create( model=model, messages=messages, extra_body={ "enable_thinking": True, # "preserve_thinking": True, }, stream=True)
reasoning_content = "" # 完全な推論トレースanswer_content = "" # 完全なレスポンスis_answering = False # 回答フェーズに入ったかどうかprint("\n" + "=" * 20 + "推論" + "=" * 20 + "\n")
for chunk in completion: if not chunk.choices: print("\n使用量:") print(chunk.usage) continue
 delta = chunk.choices[0].delta
 # 推論コンテンツのみを収集 if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None: if not is_answering: print(delta.reasoning_content, end="", flush=True) reasoning_content += delta.reasoning_content
 # コンテンツを受信、回答フェーズを開始 if hasattr(delta, "content") and delta.content: if not is_answering: print("\n" + "=" * 20 + "回答" + "=" * 20 + "\n") is_answering = True print(delta.content, end="", flush=True) answer_content += delta.content

詳細については、API ドキュメントをご覧ください。

コーディング & エージェント#

Qwen3.6-35B-A3B は優れたエージェント型コーディング機能を備えており、OpenClaw、Claude Code、Qwen Code などの人気のあるサードパーティ製コーディングアシスタントとシームレスに統合できます。

OpenClaw#

Qwen3.6-35B-A3B は、セルフホスト型のオープンソース AI コーディングエージェントである OpenClaw（旧 Moltbot / Clawdbot）と互換性があります。これを Model Studio に接続することで、ターミナルで完全なエージェント型コーディング体験を得ることができます。以下のスクリプトから始めてください。

bash
# Node.js 22+curl -fsSL https://molt.bot/install.sh | bash # macOS / Linux
# API キーを設定export DASHSCOPE_API_KEY=<your_api_key> 
# OpenClaw を起動openclaw dashboard # ウェブブラウザ# openclaw tui # 新しいターミナルを開き、TUI を開始

初回使用時は、~/.openclaw/openclaw.json を編集して OpenClaw を Model Studio に向けます。以下のフィールドを見つけてマージしてください。既存の設定を保持するため、ファイル全体を上書きしないでください。

json
{ "models": { "mode": "merge", "providers": { "modelstudio": { "baseUrl": "https://dashscope-intl.aliyuncs.com/compatible-mode/v1", "apiKey": "DASHSCOPE_API_KEY", "api": "openai-completions", "models": [ { "id": "qwen3.6-flash", "name": "qwen3.6-flash", "reasoning": true, "input": ["text", "image"], "contextWindow": 131072, "maxTokens": 16384 } ] } } }, "agents": { "defaults": { "model": { "primary": "modelstudio/qwen3.6-flash" }, "models": { "modelstudio/qwen3.6-flash": {} } } }}

Qwen Code#

Qwen3.6-35B-A3B は、ターミナル向けに設計され、Qwen シリーズに深く最適化されたオープンソース AI エージェントである Qwen Code と互換性があります。以下のスクリプトから始めてください。

bash
# Node.js 20+npm install -g @qwen-code/qwen-code@latest 
# Qwen Code を開始（対話モード）qwen 
# その後、セッション内で:/help /auth

初回使用時にログインを促すメッセージが表示されます。認証方法はいつでも /auth を実行して切り替えることができます。

Claude Code#

Qwen API は Anthropic API プロトコルもサポートしているため、Claude Code などのツールで使用して、さらに高度なコーディング体験を得ることができます。

bash
# Claude Code をインストールnpm install -g @anthropic-ai/claude-code 
# 環境を設定export ANTHROPIC_MODEL="qwen3.6-flash"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-flash"export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic export ANTHROPIC_AUTH_TOKEN=<your_api_key> 
# CLI を起動claude

要約#

Qwen3.6-35B-A3B は、スパースな MoE モデルが驚異的なエージェント型コーディングおよび推論能力を達成しうることを実証しました。わずか 30 億のアクティブパラメータで、アクティブなサイズの何倍もの密なモデルに匹敵するパフォーマンスを提供し、マルチモーダルベンチマークでも卓越した成果を上げています。完全にオープンソースのチェックポイントとして、この規模で可能なことの新たな基準を打ち立てています。

今後、私たちは Qwen3.6 オープンソースファミリーを拡大し続け、効率的でオープンなモデルが達成しうる限界を押し広げていきます。コミュニティからのフィードバックに感謝し、皆様方が Qwen3.6-35B-A3B で何を構築してくださるのかを楽しみにしています。また、Qwen3.6 オープンソースファミリーは今後も拡大を続けますので、今後のリリースにもご期待ください。

引用#

Qwen3.6-35B-A3B が役立つとお感じになった場合は、以下の記事をご引用ください。

bibtex
@misc{qwen36_35b_a3b, title = {{Qwen3.6-35B-A3B}: Agentic Coding Power, Now Open to All}, url = {https://qwen.ai/blog?id=qwen3.6-35b-a3b}, author = {{Qwen Team}}, month = {April}, year = {2026}}