「Qwen3.6-Plus」のリリースに続き、当社は次世代フラッグシップモデルの早期プレビュー版である「Qwen3.6-Max-Preview」をお披露目いたします。今回のプレビュー版は、Qwen3.6-Plus と比較して世界知識および指示追従性が大幅に強化され、多数のベンチマークにおいてエージェント・プログラミング性能が顕著に向上しているのが特徴です。なお、本モデルは現在も精力的に開発・改良が続けられているプレビュー版であり、今後のバージョンでさらなる最適化が見込まれます。
Qwen3.6-Max-Preview の主な特徴は以下の通りです。
- Qwen3.6-Plus と比較して著しく向上したエージェント・プログラミング能力
- 強化された世界知識および指示追従性
- 実社会のシナリオにおける、より優れたエージェント性能と知識の信頼性
本モデルは、Qwen Studio(https://chat.qwen.ai/)にて対話形式でお試しいただけるほか、間もなく阿里云百煉(Alibaba Cloud Bailian)API を通じてqwen3.6-max-previewというモデル名で呼び出せるようになります。
モデル性能
以下では、Qwen3.6-Max-Preview と主要な最先端モデルとの評価比較結果を示します。Qwen3.6-Plus と比較し、プレビュー版はエージェント・プログラミング分野で顕著な進歩を遂げました(SkillsBench で +9.9、SciCode で +10.8、NL2Repo で +5.0、Terminal-Bench 2.0 で +3.8 のスコア向上)。また、世界知識(SuperGPQA で +2.3、QwenChineseBench で +5.3)や指示追従性(ToolcallFormatIFBench で +2.8)の各項目でも優れた結果を残しています。
ご利用方法
Qwen3.6-Max-Preview について
Qwen3.6-Max-Preview は阿里云百煉 API を通じて提供され、モデル名はqwen3.6-max-previewとなります。また、Qwen Studio上でも即時に体験可能です。
API の更新情報
阿里云百煉は業界標準のプロトコルをサポートしており、OpenAI 仕様に準拠したチャット補完(chat completions)およびレスポンス(responses)API、さらに Anthropic 製 API との互換性も備えています。
今回のリリースではpreserve_thinking機能をサポートしました。これは、メッセージ内にそれまでのやり取りにおける思考プロセスをすべて保持する機能であり、エージェントタスクでの活用を特におすすめします。
まとめ
Qwen3.6-Max-Preview は、次世代フラッグシップモデルの早期プレビュー版として、エージェント・プログラミング、世界知識、指示追従性の各分野において Qwen3.6-Plus を大きく上回る性能を発揮します。SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench、SciCode という 6 つの主要なプログラミングベンチマークで最高スコアを記録し、前身モデルから飛躍的な進歩を遂げました。同時に、知識分野(SuperGPQA、QwenChineseBench)や指示追従性(ToolcallFormatIFBench)の各評価でも優れた結果を示しています。
プレビュー版である Qwen3.6-Max-Preview は現在も活発に開発中であり、今後のバージョンでさらなる性能向上が見込まれます。コミュニティの皆様からのフィードバックを心より歓迎するとともに、皆様の創造的な成果を拝見できることを楽しみにしております。引き続きご注目ください。