HTML已死!前OpenAI工程師掀起網頁革命:用AI將整個螢幕變成無限直播像素串流,無一行HTML程式碼,網友:傳統Web開發結束,前端真要失業了!

想像一下:你打開瀏覽器,沒有程式碼、沒有HTML、沒有CSS佈局引擎。螢幕上每一幀畫面,都是AI模型即時生成的像素影片串流。

它能瞬間理解你的意圖,動態重塑整個介面——從巴黎旅行規劃到複雜資料視覺化,全是手繪級插圖般生動,還能隨點擊無縫變形、互動。

滿滿的科幻降臨既視感!

這就是Zain Shah(前OpenAI、YC校友)和團隊剛剛發布的 Flipbook 原型。

Flipbook產品截圖

體驗網址:flipbook.page

短短一天,X平台爆紅,突破兩百萬瀏覽。網友們已經玩瘋了!手機上也能玩。

Flipbook手機操作展示

如果你開啟即時影片串流模式,體感會更震撼~

Zain放出了優化後的LTX Studio影片模型實現的真實演示:1080p 24fps即時串流傳輸,背後是Modal GPU伺服器。

即時影片串流展示

傳統Web開發範式被徹底擊穿:

無需前端佈局,上網就像翻書一樣。

現在的網頁閱讀,「是由僵硬的程式碼和規則生成的,這使得傳達複雜而詳盡的想法變得困難。」

而Flipbook摒棄了這一點,它的理念是:一圖勝千言。你落到的每一個「頁面」都是一張圖像。

奇妙之處在於,點擊圖像中的任何一個角落,你都會得到一張新的圖像,可以繼續對該事物進行更深入的探索。

你所看到的內容都不包含任何HTML、程式碼、特定的連結或欄位。整個網路僅僅是顯示在你螢幕上的生成像素,甚至連文字也都是圖片中的像素構成。

真正的翻書頁般的體驗。

翻書般瀏覽體驗展示

過去20年,我們依賴HTML + CSS + JavaScript + React等構建介面。現在,Flipbook把一切簡化為「像素串流」:模型直接決定你看到什麼、怎麼互動。

  • 無需佈局引擎:插圖隨視窗自適應變形,不再被CSS框死。

  • 全螢幕互動:任何像素都能回應點擊,模型即時判斷意圖,不再侷限於預定義按鈕。

  • 視覺優先:複雜概念用插圖、動畫、真實渲染表達,而不是枯燥文字和矩形框。

這給我的一個訊號就是:前端工程師的「寫程式碼搭介面」時代可能走向終結。

AI原生瀏覽,真的無敵。

小編立刻去體驗了一把,的確有一種「無限探索式閱讀」的感覺。

例如:今天Qwen3.6-27B模型發布了,之前總要仔細看下各項基準評分的對比,現在我直接交給Flipbook幫我解讀了。

我點擊了業界現在非常關注的「SWE-bench Verified」,片刻後,它就像一個放大鏡工具一樣,幫我生成了更為具體的對比數字和分析。

我繼續點擊強相關的Agentic Flow,它就給出了可視覺化的迴圈圖。

Flipbook解讀模型基準展示

這種自帶強烈探索感的互動方式前所未有。

如果你想返回上個頁面怎麼辦,導航欄裡已經幫你做好了路徑記憶,只需要回溯點擊即可。

Flipbook導航欄路徑記憶展示

別小看這個小工具,外界將此視為一個行業地震訊號。

除了解讀複雜的圖表,我還發現了別的妙用:解讀現實人物微表情。

解讀明星的表情特質。本著不浪費的原則,我把「沈騰時代週刊封面」餵給了Flipbook。這表情,從眉毛、眼睛到鼻子、嘴,就連酒窩也被解讀得明明白白的。

得,沈騰這張臉,太權威了。

沈騰圖片被解讀展示

其實還有很多奇怪的用途,只有你想不到,沒有Flipbook做不到的。

讓它幫小學生做作業,抽象的數學題全都被「視覺化」了,這不就很容易解題了嗎?

總之,所有抽象的東西到這裡都變得形象、容易感知了起來!

數學題視覺化解讀展示

不止這些,想像空間很大,但凡是圖片都能給它解讀。

直播中不認識嘉賓是誰,可以找它(ps:現在能力還不夠強,只能識別出知名度高的人物,容易翻車)。

人物識別展示

更絕的來了!

沒有圖片,怎麼辦?你可以直接在網址列輸入提示詞(prompt)。比如小編我就試了:

幫我做一張櫻木花道灌籃動作的拆解圖!

AI生成灌籃動作拆解圖展示

而且,別忘了,其實上面的每一幀畫面都有更高階的「即時影片串流」版本,只怪小編的網速不夠,不然可以直接看櫻木花道灌籃的慢動作了。

高階即時影片串流展示

可想而知,未來的產品原型也將從「畫線框圖」變成「直接下提示詞生成可互動影片介面」。

產品原型設計演進展示

而低程式碼/無程式碼,也將進化成「零程式碼AI原生介面」。

無限視覺的AI原生瀏覽器:

AI影片模型的即時化突破。

Zain在X上特別提到了即時影片的進化技術:優化版的LTXStudio影片模型。

「為了讓這些圖片栩栩如生地活過來,我們對@LTXStudio的影片模型進行了大幅優化。它能直接以24fps的速度向用戶的螢幕串流傳輸1080p影片,通過WebSocket直接連接到@modal_labs的無伺服器GPU基礎設施。」

LTX Studio影片模型技術展示

現在看起來,這個Flipbook既像AI原生瀏覽器,又像AI原生播放器。而且互動起來毫無磕絆感,這跟一般的影片生成大不相同,怎麼實現的呢?

其實,Flipbook背後的核心技術,是Lightricks(一家專攻AI-first創意的以色列科技公司)的LTX-2/LTX-2.3系列開源DiT模型。它可以實現高壓縮潛在空間、多尺度渲染、同步音影片,速度快於即時(在H100上幾秒生成數秒影片),支援原生4K/1080p直式畫面。

有了它,生成的影片就具備了即時、狀態感知、互動式生成的能力。結合代理式搜尋,模型還能拉取即時資料,確保準確性。

代理式搜尋結合影片串流展示

下一步野望:結構化UI程式設計。

如此高燃的產品體驗,下一步會怎樣放大呢?

Zain坦承Flipbook還很有限,所以團隊目前選擇圍繞視覺解釋來設計它。

但其實他們的野心更大:隨著模型變得更準確和更有狀態,這種方式值得做的事情集合將會擴展。甚至那些你認為需要結構化UI的,比如程式設計。

結構化UI程式設計展望展示

正如剛才提到的,這項技術可以顛覆我們現有的幾乎所有工作流程,速度也會十倍提升:

  • UI/UX設計:從靜態模型到動態影片原型,迭代速度提升10倍以上。設計師下一句提示詞,就能測試完整使用者旅程。

  • 內容創作與教育:旅行規劃、教學、資料故事,全變成沉浸式視覺敘事。教育界可能迎來「AI動態教科書」。

  • 電商/產品演示:商品頁面不再是圖片+文字,而是即時生成的類3D互動場景,根據使用者偏好進行個人化變形。

  • 遊戲與AR/VR:即時生成過場動畫、介面,為輕量級AI驅動體驗鋪路。

這還沒完,當前的產品體驗還受限於模型能力的上限。如果模型發展到足夠穩定的狀態,整個軟體介面都可能變成「生成式」。

到那時,瀏覽器還在,但裡面跑的不再是網頁,而是AI驅動的「無限視覺瀏覽器」。

Flipbook的背後:

兩個字:燒錢,但未來很值得。

但,如此前瞻的技術體驗,想要繼續規模化普及到每一個人,還是有不小的難度。

主要還是算力成本問題。大家都知道,傳統網頁客戶端渲染幾乎免費,然而,Flipbook需要伺服器端持續GPU推理。頻寬和成本的瓶頸(影片串流vs文字串流的50至150倍差距)需要解決。

但這塊問題並非無解。如果按照黃仁勳、a16z等業內人士或機構的說法,推理算力的成本每年都會下降至原來的20%,甚至10%,此外開源模型的本地化(FP8量化)節奏也在加速。預計5到10年內,經濟性方面的問題就會被打下來。

此外,Lightricks等公司正推動開源+企業版,Modal等基礎設施已就緒。誰先解決規模化,誰就吃到最大紅利。

更大的一個訊號是:網際網路計算正規化從「客戶端主導」轉向「雲端AI生成主導」。那麼,我們現在所有的技術堆疊:雲端運算、邊緣運算、瀏覽器架構都會被重塑,甚至會催生新的「AI OS」。

背後團隊。

小編也扒了一下Flipbook背後的團隊背景。

Flipbook背後的團隊,其實是一個小型、跨界協作的「創意技術」小組,而不是傳統意義上的正式公司團隊。

某種程度上,它甚至可以說是一個side project,是由一群熱情的maker和技術極客在社群實驗室環境中快速拼湊而成的。

其中的核心人物:Zain Shah,是主導者和發起人。Zain的履歷包括:三星的創意技術專家,他負責三星未來設備、穿戴裝置、AI助手等原型開發。再之前則是OpenAI研究員,當然了他還是YC S13校友(曾創辦Watchsend)、Opendoor資料科學/工程經驗。

總之,Zain非常擅長將AI與互動介面、硬體原型結合。

此外,值得一提的是,他還共同創立了MadSci,舊金山中心的一個非營利社群創客空間和實驗室。Flipbook的很多靈感和實際開發很可能發生在這裡。

另外,他在個人網站上提到Flipbook時,用了「It took a village」(這需要整個村莊/集體努力),顯示這是一個協作成果,而非他一人完成。

It took a village引言截圖

Zain在Flipbook發布貼文中也特別感謝以下幾位:

舊金山創業者社群South Park Commons成員,曾任職Humane、Slack、Brown的Eddie Jiao,沒錯,又是東方面孔!

Eddie Jiao個人照片

另一位核心成員則是曾任職蘋果的Drew O'Carr。

Drew O'Carr個人照片

從這幾位的履歷不難看出,三位都有一個共性,都是探索「AI時代介面型態」的實驗型構建者。

AI原生互動時代爆發前夜。

從2023年開始,業界就已經開始喧喧嚷嚷地討論起「AI原生產品的樣貌」的話題。

大家對於生成式AI時代,產品到底該長什麼樣子,做出了不少探索。

從在傳統網際網路產品中添加「Chat框」,再到ClaudeCode式的純CLI,前者已經被稱為雞肋,後者則很難在非程式設計師群體中快速推廣。

但Flipbook似乎有希望做到!

從寫CSS轉向提示詞工程、從在網址列中寫一句提示,就讓想得到的資訊在上一幀像素之間流動重組。

圖片即一切的可互動體驗,配合提示詞的生成魔法,可以說觸碰到了「AI原生瀏覽器」的定義點。

可以預見,我們未來的一切互動,不管是工作中的行銷設計、程式設計、寫PPT、做原型設計,還是平時生活中的旅遊出行、教小孩寫作業、搜明星熱搜,這些體驗都有可能迎來全新的「視覺化」重塑。

寫在最後:HTML離隱退不遠了。

當然,正如前文所說,Flipbook目前還是原型階段,主要用於「視覺化解釋」,實際速度還有優化空間。

但它清晰指向未來:當AI模型夠快、夠聰明,介面將像現實世界一樣豐富、即時、個人化。

可以想像,我們的網站終將革掉「填色塊的網頁」的形態,化身成「為每一個人量身生成的視覺宇宙」。

總之,HTML距離隱退江湖,已經不遠了!

可以肯定的是,這波AI介面革命,才剛剛開始。

參考連結:

https://x.com/zan2434/status/2046982383430496444

https://medium.com/@kapildevkhatik2/ltx-2-the-open-source-audio-video-generation-model-changing-content-creation-979100b131b5

https://sandner.art/ltx-video-locally-facts-and-myths-debunked-tips-included/

相關文章推薦

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.