自 KAT-Coder-Pro V1 發布以來,我們持續收到來自第一線開發者的寶貴回饋與建議。這些真實的使用洞察,驅動我們在實際應用場景中不斷打磨,拓展 KAT 系列模型的能力邊界。
KAT-Coder-Pro V2 是 KwaiKAT 最新打造的旗艦級 Agentic Coding 模型。在 Agentic 場景下,KAT-Coder-Pro V2 具備強大的腳手架泛化能力,相容 10 多種主流的 AI 編碼工具,例如 Claude Code、Cline、Kilo、OpenCode,提供更大的靈活性。並針對 OpenClaw 進行了專項訓練與深度優化,能夠從容應對真實世界中的複雜應用流程。
與此同時,KAT-Coder-Pro V2 在前端美學生成方向取得突破性進展——在 Landing Page 和 PPT 場景中,使用者僅需口語化描述,即可獲得接近結構化設計規格書輸入水平的高品質輸出。這意味著模型的服務邊界從過去僅 1% 量級的專業用戶,真正擴展到億級普通用戶。
原生適配 OpenClaw,多 Agent 框架深度優化
在 AI Coding 的真實落地場景中,以 OpenClaw 為代表的 AI Agent 框架持續高頻迭代,不斷引入新工具與新協定,這對模型的腳手架泛化能力提出了巨大挑戰。工具呼叫失敗、多步任務中斷、指令理解偏差,是模型在實際使用中頻繁暴露的問題,而在高頻使用場景下,這些問題會被成倍放大,直接影響使用者體驗。
模型能力的真正邊界,不只是程式碼生成品質是否過關,更在於面對工具不斷擴展、任務鏈路持續拉長的複雜環境時,能否在長程軌跡中始終準確理解使用者意圖,並在不同 Agent 框架下保持穩定、一致的表現。無論是 Claude Code 還是 OpenClaw,使用者都應當能夠無縫切換、放心使用,而不是在框架切換時重新踩坑。
為此,KAT-Coder 從資料建置到訓練流程,圍繞多腳手架泛化能力進行系統性設計,並針對 OpenClaw 使用場景從原生任務資料出發進行全鏈路專項優化——不僅覆蓋腳手架協定理解與工具鏈呼叫,更在訓練階段對長鏈路執行穩定性進行深度強化。
最終評測結果顯示,KAT-Coder 在複雜 Skills 遵循率與多步任務完成率上取得顯著提升,在定時觸發、高吞吐、長鏈路等高壓場景下的執行效率與回應穩定性同步達到業界一流水平。
值得一提的是,KAT-Coder-Pro V2 的腳手架泛化能力並不侷限於 OpenClaw 單一框架。我們同步在 Claude Code、OpenCode 等主流腳手架上進行了評測,結果表明模型在跨框架場景下同樣具備出色的適配能力。
Web Coding - 當模型開始懂「美」
「打破舊共識:現有評測的系統性盲區」
當前主流的程式碼生成評測(如 WebArena 等),本質上都在玩「找不同」——給一張參考圖,看 AI 照貓畫虎還原得像不像。但這在「一句話生成網頁」的場景裡,存在嚴重的錯位。
在商業化應用裡:「程式碼跑得通」與「設計好看」是兩碼事。程式碼還原度測的是「程式碼對不對」(有沒有報錯錯位),靠演算法就能算;美學還原度測的是「頁面好不好看」,是高級的審美判斷,程式碼跑通只是起跑線。
現有評測標準嚴重偏科,留下了六大盲區:
1. 使用者只給一句話,根本沒有「標準答案」讓 AI 去對比。
2. 影像演算法會給具有突破性的原創設計打低分。
3. 靜態截圖根本抓不到互動動畫的好壞。
4. 演算法無法量化「高階商務感」這類抽象詞。
5. 只看單個按鈕好不好,不管整體排版搭不搭。
6. 現有的演算法打分反而會逼迫 AI 走向最平庸、最安全的設計。
「KAT Benchmark:立足專業設計的產業新標竿」
基於快手研發設計團隊深厚的人文視覺與前端積澱,我們填補了空白,推出由專業設計師與合作團隊校準完成的「KAT 美學 Benchmark」。作為業界唯一針對「無參考圖創作」的純美學標準,它有四大優勢:
• 堅持設計師人工盲測,拒絕唯演算法論——真正的審美無法被機器取代。
• 首創 10 大獨立評估維度,顆粒度遠超學術界現有標準。
• 「出彩無瑕疵」才是滿分,而不是「最像參考圖」,鼓勵原創,懲罰平庸。
• 嚴苛的設計與評審機制,專業設計師團隊在統一的標準螢幕下執行深度互動盲測。
「拿資料說話」
在最嚴苛的尺規下,KAT 展現出統治力:
• PPT 場景輾壓:總分 57.6,領先競品 14~22 分,配色項目高達 78 分;圖片得分更是競品的 5~8 倍。
• Landing Page 霸榜:總分 59.8 拿下第一,在配色、元素、布局建立起堅不可摧的優勢。
• 震撼躍升:對比上代基線,PPT 均分翻倍(+103%),LP 提升 +42%,元素單項暴增 +300%。
在 Benchmark 上的每一次跨越,都在讓「一句話生成專業級商業頁面」一步步走向現實。
「PPT 案例」
「Landing Page 案例」
更強大的基座能力
Agentic 場景下的複雜推理,離不開扎實的通用基座能力作為支撐。KAT-Coder-Pro V2 的基礎模型在 Terminal-Bench Hard(46.8)、𝜏²-Bench Telecom(93.9)等主流基準上全面進入全球第一梯隊,為上層 Coding 能力提供了堅實的底層保障。
現在開始
KAT-Coder-Pro V2 現已全量上線,使用者可以透過以下方式立即體驗:
方式一:API 呼叫
透過 StreamLake.com 平台直接呼叫模型 API,靈活整合到你的工作流程中。
API KEY 申請:
https://streamlake.com/product/kat-coder
方式二:Coding Plan 訂閱
KAT-Coder-Pro V2 已納入 Coding Plan 方案,開箱即用。我們提供四種方案,你可以根據自己的使用頻率按需選擇:
Coding Plan 訂閱:
https://www.streamlake.com/marketing/coding-plan
開發工具接入指南(點擊下方連結即可查看):
https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9
期待與開發者朋友們碰撞出更多火花。