剛剛,國產影片模型登頂全球第一!給谷歌 Veo 上了一課,還把錢給掙了

圖片

新智元報導

編輯:犀牛 KingHZ

【新智元導讀】站在 2026 年春天回望,Sora 浪潮之後,SkyReels V4 用四位一體頂級能力(多模態參考 + 音視頻聯合 + 統一任務框架 + 全模態強化)登頂全球第一!AI 影片創作的「大一統」時刻,真正屬於中國的時代來了!

國產影片生成模型,第一次站上了世界最頂端

就在剛剛,第三方機構 Artificial Analysis 最新榜單裡,SkyReels V4 拿下了「文字生成影片(含音訊)」全球第一!

圖片

圖片

它壓過了谷歌 Veo 3.1,也超過了 Kling 3.0。

更關鍵的是,這個榜單不是廠商自己跑分。看的是大量真實用戶的盲評結果。

這標誌著,在最難、也最具價值的「文生影片 + 音訊」賽道裡,國產模型已經衝到了最前面。

2 月 27 日,SkyReels V4 Preview 首次亮相時,已經拿到全球第二。

不到一個月,SkyReels V4 又往前跨了一步,直接衝到第一。

SkyReels V4 不只是更強了,它已經開始改寫全球影片模型的排位。

它標誌著中國 AIGC 影片技術正式引領世界。

在 2026 中關村論壇,SkyReels-V4 即將正式重磅發布,API 已經開放(skyreels.ai)。

圖片

連結:https://www.skyreels.ai/api-platform

在其他模態上,SkyReels V4 也表現出色,在「文字到影片(無音訊)」中排名第二。

圖片

空談數據,不如直接看能力。接下來,好好看看全球第一的影片 AI 到底有多猛。

圖片

實測:AI 短劇之王

對崑崙萬維天工 AI 而言,SkyReels 開始邁向完整的多模態影片生成系統轉型,支援文字、圖像、影片和音訊輸入。

它是全球首個同時支援多模態輸入、聯合音視頻生成、統一生成/修復/編輯任務的影片基礎模型。

下面六個方向的實測,每一個都能讓你感受到這款模型的恐怖之處。

AI 短劇生成:兩張圖 + 一段台詞,直出影院級短劇。

你只要丟進兩張角色圖,再寫一段台詞。

SkyReels-V4 就能直接吐出一段 1080p、32FPS、15 秒的影片。

畫面質感、角色表情、嘴型同步,幾乎沒什麼 AI 味兒。

不管是東方臉孔還是西方面孔,效果都極其自然。

雷鳴交加,荒原上風沙漫捲,關公秦瓊展開史詩對決——

從簡單文字到完整影片 + 音訊,零基礎也能輕鬆創作電影級內容,真正做到「想拍什麼,就拍什麼」!

關鍵是 AI 味兒,幾乎沒了。

更關鍵的是,這次不是「先出畫面,再硬貼聲音」。

SkyReels-V4 專門被設計為同時處理畫面和聲音。

多幀參考:九張圖,終於把角色和劇情都釘住了。

此次 SkyReels-V4 最重磅的升級之一,是多幀參考。

你最多可以給它 9 張關鍵幀。

它會按這 9 張圖,把中間的動作、鏡頭和過渡補出來。

這很重要,很實用。

以前做 AI 短劇,最容易翻車的就是兩點:

  • 前一秒還是這張臉,後一秒就「換臉」了;
  • 剛剛還在這個場景,轉頭就跳到了另一個世界。

SkyReels-V4 這次最實用的進步,就是把這兩個坑壓下去了,當之無愧的 AI 漫劇之王。

圖片圖片

圖片圖片

提示詞示例:「@圖片 -1 的光背青年不斷向前奔跑,期間會出現好幾個拐角,鏡頭追蹤;隨後鏡頭切換至@圖片 -2,青年赤裸了上半身,繼續向前奔跑然後急轉彎;隨後鏡頭切換至@圖片 -3,他露出了詫異的表情;最後鏡頭切換至@圖片 -4,他向右擰動了轉盤,一大股濃煙佔據了畫面。」

這種影片控制能力,簡直絕了。

風格也是完全統一。對於這種漫劇而言,更是沒有一絲 AI 味。

再比如這段神似「無臉男」怪物的動畫。

圖片

根據@圖片 -1 中的動漫情節,按從上到下、從左到右的順序自然過渡展開,生成一個動畫短片。

打鬥的畫面相當絲滑,特寫鏡頭切換也是相當合理。

這種玄幻風格的動畫也不在話下。

圖片

得益於 SkyReels-V4 的音、畫同步生成能力,人物說話對口型不再是難題。

一站式影片編輯,用嘴剪影片。

更狠的是,它不只會生影片,還會直接改影片,堪稱後期神器。

你可以讓它做三類事:

第一類,往畫面裡加東西。

給角色戴帽子,往房間裡擺花,把一個新人物塞進原場景。

圖片圖片

Add the blue ribbed knit beanie from @image_1 onto the head of the central dancer in @video_1.

一句話,就把帽子加到小姐姐頭上了。

更令人震驚的是,各個角度都十分完美。

太驚豔了。

圖片

第二類,改角色動作。

讓新加進來的人物跟著原角色一起跳舞,或者把動作重新綁定過去。

圖片圖片

Add the colorful fursuit character from @image_1 into the urban dance scene in @video_1, placing them on the dance floor next to the dancer. The character should mirror the dancer's movements with a playful, exaggerated dance style.

不僅把角色加進去了,更厲害的是,還能配合原來的人跳舞。

這個影片生成理解能力,絕了。

圖片

第三類,直接做清理。

去字幕,去水印,去台標,刪路人,刪動物,刪掉一切不想要的干擾物。

這種在模型充分理解影片基礎之上的編輯能力,簡直太強了。

圖片圖片

過去你需要在 Premiere、AE、各種 AI 工具之間反覆切換才能完成的工作,現在 SkyReels-V4 一個模型就全搞定。

換句話說,影片生成、元素植入、角色編輯與畫面清理,正在被收斂到同一套通用編輯框架裡。

這次的一大突破,是把影片生成、補幀、延展、編輯統一進同一套接口,讓文生影片、圖生影片、影片延展、首尾幀插值,以及區域、全域編輯,都落在同一種處理框架下。

圖片

技術硬突破:憑什麼硬剛 Seedance 2.0?

看完效果,我們來看看 SkyReels-V4 背後的技術到底硬在哪裡。

上個月,SkyReels V4 Preview 登上全球現役模型排名第 2 時,我們就做過詳細的分析報導。——Seedance2.0 炸場後,又一中國黑馬登頂 AA 榜單! AI 味沒了。

不到一個月,從 Preview 版全球第二到升級版登頂第一——這個速度,放在遊戲裡叫「開掛」,放在 AI 圈叫「SkyReels-V4」。

SkyReels-V4 這次往前衝,靠的不是小修小補。

它主要治好了兩個影片 AI 老毛病。

第一個老毛病,是「畫面好看,但邏輯不通」。

比如,水往天上流,杯子懸在空中,還不是動漫;人一轉身,動作就穿幫。

為了解決這個問題,SkyReels-V4 在訓練時,不再只盯著「像不像」,還要判斷「對不對」。

說得直白一點,就是給模型加了一套更嚴格的評分系統:

  • 畫面要好看,動作要合理,聲音還得對上嘴型和節奏。
  • 哪裡不對,就反覆打回去重練。

這個過程,論文裡叫全模態強化學習

另一方面,團隊引入了階梯式課程強化學習機制,圍繞解析度與時長、任務複雜度、數據難度三個關鍵維度,推動模型從簡單任務逐步進階到複雜任務,持續提升對高難度生成場景的掌控能力。

你可以把它理解成:以前老師只看卷面漂不漂亮;現在老師開始同時盯邏輯、動作和表達了。

以前老師只看考試成績好不好;現在老師開始同時關注學生學習過程,改進授課方法了。

第二個老毛病,是「角色記不住」。

你給幾張關鍵幀,SkyReels-V4 就能把中間過程補出來。你給它九張劇情圖,SkyReels-V4 就能盡量把角色臉、服裝和場景風格一直鎖住。

這對 AI 短劇太關鍵了。

以前最讓人出戲的,就是角色一會兒一個樣。

以前 AI 拍短劇,男主第一集是尖下巴,第二集變成了國字臉,觀眾直接出戲。

現在有了九宮格參考,角色全程一致,場景全程連貫,AI 短劇終於從「看個熱鬧」升級到了「可以認真追」的水平。

這兩項能力把影片生成的一致性和可控性拉到了行業天花板,也讓 SkyReels-V4 從一個「影片生成工具」,正式進化為「短劇工業化生產引擎」。

SkyReels-V4 技術報告也已公開。

圖片

技術報告:https://arxiv.org/pdf/2602.21818

圖片

直面實踐的檢驗

國產 AI 版 Netflix 來了

真正值得注意的,不只是榜單,而是這套模型已經被放進業務裡跑了。

DramaWave:崑崙萬維的 AI 版 Netflix。

SkyReels-V4 的技術直接支撐了崑崙萬維旗下的短劇平台 DramaWave。

截至 2026 年 1 月,以 DramaWave 和 FreeReels 為核心的崑崙短劇平台,MAU 已突破 8000 萬大關,年化流水收入 ARR 破 4.8 億美元,月流水高達 4000 萬美元。

這不是 PPT 上的數字,而是真實的用戶在真實地付費觀看 AI 參與製作的內容。

近期,DramaWave 推出「百萬美金・劇啟 AI」創作扶持計劃,廣納全球優質創作者。崑崙萬維全新自研的 AI 短劇 Agent 工具 SkyAnime 也同步上線,從工具端為創作者賦能,全方位提升創作效率。

DramaWave 上的 AI 劇模塊已上線近千部作品,AI 自製劇月產能超 30 部。

以自製 AI 短劇《掠奪詞條!我轉職為亡靈天災》為例,依托 SkyAnime 工具製作,成本不足 2 萬美金,上線後單日投放超 10 萬美金,累計播放量達數百萬次。

這是一個完美的「技術→產品→商業化」閉環驗證。

圖片

從「片段生成」升級為工業化全鏈路影片生產。

SkyReels-V4 的意義遠不止於「能生成一段好看的影片」。

對於 AI 短劇產業而言,SkyReels-V4 解決的是最核心的痛點:角色一致性。

過去 AI 生成的短劇,角色換個鏡頭就「變臉」,觀眾根本無法入戲。

SkyReels-V4 的九宮格參考能力,讓角色在整部劇集中保持一致,讓 AI 短劇的品質第一次達到了「可以認真抓」的水平。

這對於整個 AI 影視產業來說,是質的飛躍。

為遊戲、音樂、內容生態提供統一影片生成底座。

值得注意的是,SkyReels-V4 不是一個孤立的產品。

崑崙萬維旗下還有 AI 音樂創作平台 Mureka——其 O1 模型是全球首個引入思維鏈(CoT)技術的音樂推理大模型,V8 版本在音色、演奏技法、情感表達上持續突破,用戶遍佈全球 100 多個國家和地區。

圖片

SkyReels-V4 的影片能力+Mureka 的音樂能力,構成了從畫面到聲音、從配樂到人聲的全鏈路創作閉環。

一家公司同時擁有全球頂尖的影片大模型和音樂大模型,這在全球範圍內屈指可數。

一個品牌方可以用一句話生成完整的影片廣告,一個獨立音樂人可以把歌曲直接變成高品質 MV,一個教育機構可以把課程自動轉化為配有講解、配樂和動態畫面的教學影片——這些不是暢想,而是正在發生的事。

圖片

All in AGI

回顧崑崙天工在影片大模型領域的發展軌跡,你會發現 SkyReels-V4 的崛起絕非偶然,而是一場精心佈局的戰略級爆發。

  • 2025 年 2 月,開源 SkyReels-V1——中國首個面向 AI 短劇創作的影片生成模型,基於千萬級影視數據訓練,支援 33 種微表情和 400 多種動作組合。
  • 2025 年 4 月,發布 SkyReels-V2——全球首個使用擴散強迫(Diffusion Forcing)框架的無限時長影片生成模型。
  • 2026 年 1 月,開源 SkyReels-V3——支援 1-4 張參考圖像輸入,實現多主體影片生成。
  • 2026 年 2 月,SkyReels-V4 Preview 發布——Artificial Analysis 全球榜第二。
  • 2026 年 3 月,SkyReels-V4 正式登頂全球第一。

圖片

從 V1 到 V4,它不是簡單加參數。每一代都在補一個關鍵短板。

平均每 3-4 個月一次重大升級,這種迭代節奏在全球 AI 影片領域幾乎無人能及。

這種持續創新的節奏,配合 Mureka 在 AI 音樂領域的領先地位、Skywork 系列在大語言模型和多模態推理上的突破、以及 DramaWave 短劇平台的商業化落地,崑崙萬維正在構建一個覆蓋「算力—模型—應用」的完整 AI 生態閉環。

這正是崑崙萬維自 2023 年初確立「All in AGI 與 AIGC」核心戰略以來,最具說服力的成果展示。

圖片

AI 影片創作的「大一統」時刻

站在 2026 年春天回望,AI 影片生成領域在過去一年經歷了翻天覆地的變化。

從 Sora 掀起的第一波浪潮,到 Veo、Kling、Seedance 等模型的百家爭鳴,再到 SkyReels-V4 以「全模態參考 + 音視頻聯合生成 + 統一任務框架 + 全模態強化學習」的四位一體能力登頂全球——我們正在見證一個新時代的開啟。

在這個時代裡,影片創作不再是專業團隊的專屬特權,而是每一個有創意的人都能觸及的表達方式。

而 SkyReels-V4 所代表的技術方向——用一個模型、一次操作,完成從文字構思到音視聽成品的全流程創作——正是通往那個未來的最清晰路徑。

崑崙萬維在技術報告中透露了未來三大方向:擴展更長時長(30 秒 +)的影片生成能力、增強即時互動編輯功能、開放模型 API 接口與更多創作工具生態整合。

這些方向中的每一個,都將進一步拉近 AI 影片創作與專業影視製作之間的距離。

AI 影片的競賽遠未結束。但 SkyReels-V4 已經用全球第一的成績證明了一件事:

在這條賽道上,來自中國崑崙萬維的聲音,不僅值得全世界傾聽——它已經站在了世界之巔。

秒追 ASI

⭐ 點讚、轉發、在看一鍵三連⭐

點亮星標,鎖定新智元極速推送!

圖片

圖片


分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.