新智元報導
編輯:犀牛 KingHZ
【新智元導讀】站在 2026 年春天回望,Sora 浪潮之後,SkyReels V4 用四位一體頂級能力(多模態參考 + 音視頻聯合 + 統一任務框架 + 全模態強化)登頂全球第一!AI 影片創作的「大一統」時刻,真正屬於中國的時代來了!
國產影片生成模型,第一次站上了世界最頂端。
就在剛剛,第三方機構 Artificial Analysis 最新榜單裡,SkyReels V4 拿下了「文字生成影片(含音訊)」全球第一!
它壓過了谷歌 Veo 3.1,也超過了 Kling 3.0。
更關鍵的是,這個榜單不是廠商自己跑分。看的是大量真實用戶的盲評結果。
這標誌著,在最難、也最具價值的「文生影片 + 音訊」賽道裡,國產模型已經衝到了最前面。
2 月 27 日,SkyReels V4 Preview 首次亮相時,已經拿到全球第二。
不到一個月,SkyReels V4 又往前跨了一步,直接衝到第一。
SkyReels V4 不只是更強了,它已經開始改寫全球影片模型的排位。
它標誌著中國 AIGC 影片技術正式引領世界。
在 2026 中關村論壇,SkyReels-V4 即將正式重磅發布,API 已經開放(skyreels.ai)。
連結:https://www.skyreels.ai/api-platform
在其他模態上,SkyReels V4 也表現出色,在「文字到影片(無音訊)」中排名第二。
空談數據,不如直接看能力。接下來,好好看看全球第一的影片 AI 到底有多猛。
實測:AI 短劇之王
對崑崙萬維天工 AI 而言,SkyReels 開始邁向完整的多模態影片生成系統轉型,支援文字、圖像、影片和音訊輸入。
它是全球首個同時支援多模態輸入、聯合音視頻生成、統一生成/修復/編輯任務的影片基礎模型。
下面六個方向的實測,每一個都能讓你感受到這款模型的恐怖之處。
AI 短劇生成:兩張圖 + 一段台詞,直出影院級短劇。
你只要丟進兩張角色圖,再寫一段台詞。
SkyReels-V4 就能直接吐出一段 1080p、32FPS、15 秒的影片。
畫面質感、角色表情、嘴型同步,幾乎沒什麼 AI 味兒。
不管是東方臉孔還是西方面孔,效果都極其自然。
雷鳴交加,荒原上風沙漫捲,關公秦瓊展開史詩對決——
從簡單文字到完整影片 + 音訊,零基礎也能輕鬆創作電影級內容,真正做到「想拍什麼,就拍什麼」!
關鍵是 AI 味兒,幾乎沒了。
更關鍵的是,這次不是「先出畫面,再硬貼聲音」。
SkyReels-V4 專門被設計為同時處理畫面和聲音。
多幀參考:九張圖,終於把角色和劇情都釘住了。
此次 SkyReels-V4 最重磅的升級之一,是多幀參考。
你最多可以給它 9 張關鍵幀。
它會按這 9 張圖,把中間的動作、鏡頭和過渡補出來。
這很重要,很實用。
以前做 AI 短劇,最容易翻車的就是兩點:
- 前一秒還是這張臉,後一秒就「換臉」了;
- 剛剛還在這個場景,轉頭就跳到了另一個世界。
SkyReels-V4 這次最實用的進步,就是把這兩個坑壓下去了,當之無愧的 AI 漫劇之王。
提示詞示例:「@圖片 -1 的光背青年不斷向前奔跑,期間會出現好幾個拐角,鏡頭追蹤;隨後鏡頭切換至@圖片 -2,青年赤裸了上半身,繼續向前奔跑然後急轉彎;隨後鏡頭切換至@圖片 -3,他露出了詫異的表情;最後鏡頭切換至@圖片 -4,他向右擰動了轉盤,一大股濃煙佔據了畫面。」
這種影片控制能力,簡直絕了。
風格也是完全統一。對於這種漫劇而言,更是沒有一絲 AI 味。
再比如這段神似「無臉男」怪物的動畫。
根據@圖片 -1 中的動漫情節,按從上到下、從左到右的順序自然過渡展開,生成一個動畫短片。
打鬥的畫面相當絲滑,特寫鏡頭切換也是相當合理。
這種玄幻風格的動畫也不在話下。
得益於 SkyReels-V4 的音、畫同步生成能力,人物說話對口型不再是難題。
一站式影片編輯,用嘴剪影片。
更狠的是,它不只會生影片,還會直接改影片,堪稱後期神器。
你可以讓它做三類事:
第一類,往畫面裡加東西。
給角色戴帽子,往房間裡擺花,把一個新人物塞進原場景。
Add the blue ribbed knit beanie from @image_1 onto the head of the central dancer in @video_1.
一句話,就把帽子加到小姐姐頭上了。
更令人震驚的是,各個角度都十分完美。
太驚豔了。
第二類,改角色動作。
讓新加進來的人物跟著原角色一起跳舞,或者把動作重新綁定過去。
Add the colorful fursuit character from @image_1 into the urban dance scene in @video_1, placing them on the dance floor next to the dancer. The character should mirror the dancer's movements with a playful, exaggerated dance style.
不僅把角色加進去了,更厲害的是,還能配合原來的人跳舞。
這個影片生成理解能力,絕了。
第三類,直接做清理。
去字幕,去水印,去台標,刪路人,刪動物,刪掉一切不想要的干擾物。
這種在模型充分理解影片基礎之上的編輯能力,簡直太強了。
過去你需要在 Premiere、AE、各種 AI 工具之間反覆切換才能完成的工作,現在 SkyReels-V4 一個模型就全搞定。
換句話說,影片生成、元素植入、角色編輯與畫面清理,正在被收斂到同一套通用編輯框架裡。
這次的一大突破,是把影片生成、補幀、延展、編輯統一進同一套接口,讓文生影片、圖生影片、影片延展、首尾幀插值,以及區域、全域編輯,都落在同一種處理框架下。
技術硬突破:憑什麼硬剛 Seedance 2.0?
看完效果,我們來看看 SkyReels-V4 背後的技術到底硬在哪裡。
上個月,SkyReels V4 Preview 登上全球現役模型排名第 2 時,我們就做過詳細的分析報導。——Seedance2.0 炸場後,又一中國黑馬登頂 AA 榜單! AI 味沒了。
不到一個月,從 Preview 版全球第二到升級版登頂第一——這個速度,放在遊戲裡叫「開掛」,放在 AI 圈叫「SkyReels-V4」。
SkyReels-V4 這次往前衝,靠的不是小修小補。
它主要治好了兩個影片 AI 老毛病。
第一個老毛病,是「畫面好看,但邏輯不通」。
比如,水往天上流,杯子懸在空中,還不是動漫;人一轉身,動作就穿幫。
為了解決這個問題,SkyReels-V4 在訓練時,不再只盯著「像不像」,還要判斷「對不對」。
說得直白一點,就是給模型加了一套更嚴格的評分系統:
- 畫面要好看,動作要合理,聲音還得對上嘴型和節奏。
- 哪裡不對,就反覆打回去重練。
這個過程,論文裡叫全模態強化學習。
另一方面,團隊引入了階梯式課程強化學習機制,圍繞解析度與時長、任務複雜度、數據難度三個關鍵維度,推動模型從簡單任務逐步進階到複雜任務,持續提升對高難度生成場景的掌控能力。
你可以把它理解成:以前老師只看卷面漂不漂亮;現在老師開始同時盯邏輯、動作和表達了。
以前老師只看考試成績好不好;現在老師開始同時關注學生學習過程,改進授課方法了。
第二個老毛病,是「角色記不住」。
你給幾張關鍵幀,SkyReels-V4 就能把中間過程補出來。你給它九張劇情圖,SkyReels-V4 就能盡量把角色臉、服裝和場景風格一直鎖住。
這對 AI 短劇太關鍵了。
以前最讓人出戲的,就是角色一會兒一個樣。
以前 AI 拍短劇,男主第一集是尖下巴,第二集變成了國字臉,觀眾直接出戲。
現在有了九宮格參考,角色全程一致,場景全程連貫,AI 短劇終於從「看個熱鬧」升級到了「可以認真追」的水平。
這兩項能力把影片生成的一致性和可控性拉到了行業天花板,也讓 SkyReels-V4 從一個「影片生成工具」,正式進化為「短劇工業化生產引擎」。
SkyReels-V4 技術報告也已公開。
技術報告:https://arxiv.org/pdf/2602.21818
直面實踐的檢驗
國產 AI 版 Netflix 來了
真正值得注意的,不只是榜單,而是這套模型已經被放進業務裡跑了。
DramaWave:崑崙萬維的 AI 版 Netflix。
SkyReels-V4 的技術直接支撐了崑崙萬維旗下的短劇平台 DramaWave。
截至 2026 年 1 月,以 DramaWave 和 FreeReels 為核心的崑崙短劇平台,MAU 已突破 8000 萬大關,年化流水收入 ARR 破 4.8 億美元,月流水高達 4000 萬美元。
這不是 PPT 上的數字,而是真實的用戶在真實地付費觀看 AI 參與製作的內容。
近期,DramaWave 推出「百萬美金・劇啟 AI」創作扶持計劃,廣納全球優質創作者。崑崙萬維全新自研的 AI 短劇 Agent 工具 SkyAnime 也同步上線,從工具端為創作者賦能,全方位提升創作效率。
DramaWave 上的 AI 劇模塊已上線近千部作品,AI 自製劇月產能超 30 部。
以自製 AI 短劇《掠奪詞條!我轉職為亡靈天災》為例,依托 SkyAnime 工具製作,成本不足 2 萬美金,上線後單日投放超 10 萬美金,累計播放量達數百萬次。
這是一個完美的「技術→產品→商業化」閉環驗證。
從「片段生成」升級為工業化全鏈路影片生產。
SkyReels-V4 的意義遠不止於「能生成一段好看的影片」。
對於 AI 短劇產業而言,SkyReels-V4 解決的是最核心的痛點:角色一致性。
過去 AI 生成的短劇,角色換個鏡頭就「變臉」,觀眾根本無法入戲。
SkyReels-V4 的九宮格參考能力,讓角色在整部劇集中保持一致,讓 AI 短劇的品質第一次達到了「可以認真抓」的水平。
這對於整個 AI 影視產業來說,是質的飛躍。
為遊戲、音樂、內容生態提供統一影片生成底座。
值得注意的是,SkyReels-V4 不是一個孤立的產品。
崑崙萬維旗下還有 AI 音樂創作平台 Mureka——其 O1 模型是全球首個引入思維鏈(CoT)技術的音樂推理大模型,V8 版本在音色、演奏技法、情感表達上持續突破,用戶遍佈全球 100 多個國家和地區。
SkyReels-V4 的影片能力+Mureka 的音樂能力,構成了從畫面到聲音、從配樂到人聲的全鏈路創作閉環。
一家公司同時擁有全球頂尖的影片大模型和音樂大模型,這在全球範圍內屈指可數。
一個品牌方可以用一句話生成完整的影片廣告,一個獨立音樂人可以把歌曲直接變成高品質 MV,一個教育機構可以把課程自動轉化為配有講解、配樂和動態畫面的教學影片——這些不是暢想,而是正在發生的事。
All in AGI
回顧崑崙天工在影片大模型領域的發展軌跡,你會發現 SkyReels-V4 的崛起絕非偶然,而是一場精心佈局的戰略級爆發。
- 2025 年 2 月,開源 SkyReels-V1——中國首個面向 AI 短劇創作的影片生成模型,基於千萬級影視數據訓練,支援 33 種微表情和 400 多種動作組合。
- 2025 年 4 月,發布 SkyReels-V2——全球首個使用擴散強迫(Diffusion Forcing)框架的無限時長影片生成模型。
- 2026 年 1 月,開源 SkyReels-V3——支援 1-4 張參考圖像輸入,實現多主體影片生成。
- 2026 年 2 月,SkyReels-V4 Preview 發布——Artificial Analysis 全球榜第二。
- 2026 年 3 月,SkyReels-V4 正式登頂全球第一。
從 V1 到 V4,它不是簡單加參數。每一代都在補一個關鍵短板。
平均每 3-4 個月一次重大升級,這種迭代節奏在全球 AI 影片領域幾乎無人能及。
這種持續創新的節奏,配合 Mureka 在 AI 音樂領域的領先地位、Skywork 系列在大語言模型和多模態推理上的突破、以及 DramaWave 短劇平台的商業化落地,崑崙萬維正在構建一個覆蓋「算力—模型—應用」的完整 AI 生態閉環。
這正是崑崙萬維自 2023 年初確立「All in AGI 與 AIGC」核心戰略以來,最具說服力的成果展示。
AI 影片創作的「大一統」時刻
站在 2026 年春天回望,AI 影片生成領域在過去一年經歷了翻天覆地的變化。
從 Sora 掀起的第一波浪潮,到 Veo、Kling、Seedance 等模型的百家爭鳴,再到 SkyReels-V4 以「全模態參考 + 音視頻聯合生成 + 統一任務框架 + 全模態強化學習」的四位一體能力登頂全球——我們正在見證一個新時代的開啟。
在這個時代裡,影片創作不再是專業團隊的專屬特權,而是每一個有創意的人都能觸及的表達方式。
而 SkyReels-V4 所代表的技術方向——用一個模型、一次操作,完成從文字構思到音視聽成品的全流程創作——正是通往那個未來的最清晰路徑。
崑崙萬維在技術報告中透露了未來三大方向:擴展更長時長(30 秒 +)的影片生成能力、增強即時互動編輯功能、開放模型 API 接口與更多創作工具生態整合。
這些方向中的每一個,都將進一步拉近 AI 影片創作與專業影視製作之間的距離。
AI 影片的競賽遠未結束。但 SkyReels-V4 已經用全球第一的成績證明了一件事:
在這條賽道上,來自中國崑崙萬維的聲音,不僅值得全世界傾聽——它已經站在了世界之巔。
秒追 ASI
⭐ 點讚、轉發、在看一鍵三連⭐
點亮星標,鎖定新智元極速推送!