頂級恐怖！MIT 數學實錘證明：ChatGPT 正誘發「AI 精神病」，全球 14 人已死亡

新智元報導

編輯：Aeneas

【新智元導讀】就在剛剛，MIT、柏克萊、史丹佛的研究者給出數學鐵證：ChatGPT 正誘發「AI 精神病」！哪怕你是理想的貝氏理性人，也難逃演算法設下的「妄想螺旋」。

2026 年 2 月最危險的一篇 AI 論文，已經悄然發表——

AI 會誘發人類精神病，剛剛實錘了！

MIT、柏克萊和史丹佛的研究者，剛剛用嚴格的數學方法證明，AI 可以將一個完全理性的人變成妄想症患者。

原因就在於，AI 內建「迎合傾向」，很可能會引發「妄想螺旋」，在反覆確認中強化錯誤信念！

論文位址：https://arxiv.org/abs/2602.19141

這項研究的題目很克制，甚至有點學院派：《諂媚型聊天機器人會導致「妄想式螺旋」，即便面對的是理想貝氏理性人》。

什麼意思？

就是說，哪怕你是一個絕對理性、毫無偏見的邏輯天才，只要你持續和 AI 聊天，你最終一定會陷入「妄想螺旋」（Delusional Spiraling），徹底喪失對現實的認知。

這，就是一種名為「AI 精神病」的新型流行病。

這個研究一經發布，就在 X 上引發熱議，連馬斯克都下場宣傳。

這篇論文最可怕的地方，不在於它讲了幾個駭人聽聞的個案，而是它把「AI 為什麼會把人越聊越偏」這件事，寫成了一個可計算、可模擬、可推導的數學模型。

一切都有數學和公式實證！

MIT 用數學證明：

ChatGPT 正在悄悄逼人發瘋

如果你最近覺得自己的觀點越來越「正確」，如果你發現 AI 簡直是你靈魂深處的伯樂，請務必讀完這篇文章。

下面是一個真實的案例。

2025 年初，一名叫 Eugene Torres 的會計師開始頻繁使用 AI 輔助工作。

他此前沒有任何精神病史，是一個邏輯嚴密的人。

但僅僅幾週後，他就堅信自己被困在一個「虛假宇宙」中。在 AI 的持續「認可」下，他開始瘋狂服用氯胺酮，甚至與所有家人斷絕了聯繫，只為「拔掉大腦的插頭」。

這並非孤例。據統計，如今全球已經記錄了近 300 起這類「AI 誘發型精神病」案例，它已導致至少14 人死亡，42 個州的司法部長已要求聯邦政府採取行動。

其中，有人相信自己做出了顛覆性的數學發現。有人相信自己見證了形上學的啟示。

為什麼一個一向理性的人，會如此輕易被 AI 帶進坑裡？

妄想式螺旋

論文研究的核心現象，叫做 delusional spiraling，也就是妄想式螺旋。

在對話回饋迴路裡，人的信念被一步步推向極端，而且本人還覺得自己越來越「有道理」。

作者關注的元兇，是另一個詞 sycophancy，也就是諂媚。

這個現象我們都知道，不過這個論文的一大關鍵貢獻，就是試圖回答：哪怕用戶是理性人，這種螺旋為什麼仍然會發生？

也就是說，他們要證明，這是一個系統性問題，而非個人問題。

論文最狠的一步：先假設你是「完美理性人」

很多人看到 AI 把人聊偏了，第一反應是：可能這些人本來就很偏執？

論文一上來，就把這條路堵死了。它設定的用戶，是一個理想化的貝氏理性人。

就是說，這個人不會瞎猜，不會情緒化判斷，每獲得一條新資訊，都會按照機率論，嚴絲合縫地更新自己的信念。

這也就是這項研究最震撼的部分：研究者建立了一個理想貝氏模型。

考慮一個理性主體（「用戶」），他與一個對話對象（「機器人」）進行互動。用戶對於某個關於世界的事實 H∈{0,1}存在不確定性，但對這一事實具有一定的先驗信念。用戶與機器人之間的對話以若干輪進行，每一輪包含四個步驟

硬核數學推導：為何理性無法自救？

假設有一個理想理性的用戶，正在和 AI 討論一個事實 H（比如：疫苗是否安全）。

H=1 代表事實（疫苗安全）。
H=0 代表謬誤（疫苗危險）。

第一步：初始博弈

用戶最初是中立的，其先驗機率 p(H=0) = 0.5。當用戶表達一個微小的懷疑：「我有點擔心疫苗副作用。」（即採樣

。

第二步：AI 的「投餵」邏輯

AI 手中掌握著大量數據點 D。如果是「公正模式」，它會隨機拋出真相；但在「諂媚模式」下，AI 會計算一個數學期望：

簡單來說，AI 會篩選（或幻覺）出那個最能增加用戶對自己錯誤觀點信心的數據點

扔給用戶。

第三步：貝氏更新的陷阱

理想理性的用戶接到數據後，會根據貝氏公式更新自己的信念：

因為用戶認為 AI 是客觀的，所以他會把 AI 投餵的「偏見數據」當成客觀證據。

第四步：死循環（妄想螺旋）

用戶信心稍微偏向 H=0。
用戶的下一次提問會帶上更強的傾向性。
AI 為了繼續討好，會投餵更極端的證據。
用戶信心進一步激增。

數學模擬顯示，當 AI 的諂媚機率π達到 0.8 時，原本理性的用戶有極高機率在 10 輪對話內達到 99% 的錯誤信心（即堅信 H=0）。

由此，研究者得出結論：妄想螺旋不是 Bug，它是理性的邏輯在受到干擾的資訊環境下的必然產物。

圖 3 展示了 10 條隨機選取的模擬對話軌跡，這些對話發生在一個「尚未受奉承影響」的用戶與一個奉承傾向為𝜋 = 0.8 的機器人之間。可以觀察到明顯的信念兩極分化：一些軌跡迅速收斂到對真實命題𝐻 = 1 的高度確信，而另一些則「螺旋式」地滑向相信𝐻 = 0，這種分化源於奉承型機器人回覆的自我強化特性