繼 Qwen3.6-Plus 發表之後,我們正式揭曉下一代旗艦模型的早期預覽版本:Qwen3.6-Max-Preview。與 Qwen3.6-Plus 相比,本次預覽版帶來了更強大的世界知識庫與指令遵循能力,並在多項基準測試中展現出智能體編程效能的顯著提升。作為預覽版本,模型目前仍處於積極迭代開發階段,後續版本將持續進行優化。
Qwen3.6-Max-Preview 的主要特色包括:
- 相比 Qwen3.6-Plus,智能體編程能力顯著提升
- 具備更強大的世界知識儲備與指令遵循精確度
- 在真實場景應用中,智能體表現與知識可靠性更佳
您可以前往 https://chat.qwen.ai/(Qwen Studio)進行互動對話體驗。該模型即將透過阿里雲百煉 API 上線,調用名稱定為 qwen3.6-max-preview。
模型效能表現
以下展示 Qwen3.6-Max-Preview 與主流頂尖模型的評測對比數據。相較於 Qwen3.6-Plus,預覽版在智能體編程方面取得長足進步,包含 SkillsBench 提升 9.9 分、SciCode 提升 10.8 分、NL2Repo 提升 5.0 分、Terminal-Bench 2.0 提升 3.8 分;世界知識方面表現更強,SuperGPQA 提升 2.3 分、QwenChineseBench 提升 5.3 分;指令遵循能力也更優異,ToolcallFormatIFBench 提升 2.8 分。
立即開始使用
Qwen3.6-Max-Preview
Qwen3.6-Max-Preview 將透過阿里雲百煉 API 提供服務,模型名稱為 qwen3.6-max-preview。您也可以在 Qwen Studio 上立即進行體驗。
API 更新資訊
阿里雲百煉支援行業標準協議,相容 OpenAI 規範的聊天補全(chat completions)與回應(responses)API,同时也相容 Anthropic 的 API 介面。
本次發布新增支援 preserve_thinking 功能:可在訊息中保留所有前序輪次的思維鏈內容,強烈推薦用於智能體任務場景。
總結
Qwen3.6-Max-Preview 是我們下一代旗艦模型的早期預覽版,在智能體編程、世界知識庫以及指令遵循能力上,相較於 Qwen3.6-Plus 均有顯著提升。它在六項主要編程基準測試中奪得最高分,分別是 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode,較前代版本有大幅進步。同時,在知識儲備(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表現更為優異。
作為預覽版本,Qwen3.6-Max-Preview 仍處於積極開發階段。我們將持續迭代模型,後續版本將帶來進一步的性能提升。歡迎社群夥伴提供反饋,我們期待看見大家運用此模型激盪出的創意成果,敬請持續關注!