量子位專訪陶哲軒：我為何現在創辦一個 AI x Science 組織

Jay 發自凹非寺　量子位 | 公眾號 QbitAI

數學家陶哲軒，公開了他的AI新身份——

SAIR Foundation 聯合創始人。

之前，他是舉世聞名的數學天才，年少成名的傳奇數學家、13歲加冕IMO最年輕金牌得主……24歲就成為加州大學洛杉磶分校（UCLA）史上最年轻的終身正教授。

最近幾年，隨著ChatGPT爆紅，他也成為了AI×數學的旗幟性人物，並開始更頻繁地思考和討論AI與基礎科學交叉的可能性。

而在2026年剛剛開年，50歲的陶哲軒再進一步，以聯合創始人的身份發起SAIR Foundation，希望這個旨在重塑AI與科學關係的非營利聯盟，能夠連接學術界和產業界，並團結並幫助更多年輕科學家共同推進兩大目標：

一、用科學的方法打造AI；二、借助AI重塑基礎科學研究。

△ SAIR Foundation主要專家成員

在SAIR Foundation對外官宣後，陶哲軒和Chuck NG——SAIR的兩位聯創，也在量子位的獨家專訪中，談論了他們關於AI x Science、數學、基礎科研等等相關的一切。

在他們看來，AI x Science最令人興奮的地方，在於科研的普惠化。他們希望透過SAIR這座橋樑，能讓更多年輕人打開象牙塔的大門。

未來，世界上可能會有一萬個陶哲軒。

上面這些只是冰山一角。在此次超過90分鐘的深度對談中，你還會看到以下精彩觀點：

如果AI在回答時能表達置信度，例如“我比較有把握”或“這裡不太確定”，其實際可用性將大幅提升。
學術界與產業界各司其職的模式走不通，速度太慢了，AI時代需要兩者緊密合作。
相比金融和醫療，科學是一個更安全的AI實驗場，相較之下，算錯一道數學題幾乎沒有任何損失。
看似重複、枯燥的基礎性工作，其實對人的成長非常重要，年輕人需要這些寶貴的訓練機會。
大部分學科都在彼此交流，而AI正是促成這種跨學科互動的重要催化劑。
不要簡單禁止新技術，高校的任務是教會學生如何正確使用它。
需要解決科研體系的結構性瓶須，透過跨學科的全球協作，以科學、安全的方式加速通用人工智慧（AGI）和超級人工智慧（ASI）的演進。

下面附上經校對後的完整訪談文字，全文超過1.5萬字。為了提升可讀性，量子位在不改變原意的前提下，對內容進行了適當的整理與刪減。

請享用。

AI X Science需要自己的垂直AI

量子位：首先，祝賀SAIR Foundation成立。能否和我們聊聊發起這個AI x Science機構的動機？

陶哲軒：我相信AI將從根本上改變科研模式，而我們首先要釐清的核心問題是：如何在科研情境中合理、高效地運用AI？

事實上，我們需要一些高品質的試點計畫，來展示什麼是最佳實踐，讓其他科學家可以參考、學習。

過去，這類工作主要由大學、科研機構和政府部門推動。但在當前環境下，來自其他領域的同樣重要。它更具彈性，能幫助我們嘗試一些創新性的事。

我很高興能參與創立這個機構，希望透過此途徑探索新想法，嘗試更大膽的路徑，看看當AI與科學以更審慎的方式結合時，究竟能走多遠。

Chuck：我一直都很享受與優秀科學家合作，能與Terry（陶哲軒）一起發起這個組織，我真的非常興奮。同時還有多位諾貝爾獎和圖靈獎得主一起加入。

Terry剛才更多談了學術面，而我自己長期推動學術與產業融合發展，這也是我們對此項目格外熱忱的原因之一。

如果你看看我們的啟動活動，會發現，參與者匯聚了全球頂尖學術研究者及多家科技領域企業代表，包括NVIDIA、OpenAI、Amazon、Microsoft等，各方圍繞AI x Science的發展展開交流探討，為後續跨領域協作奠定基礎。

當學術界與產業界坐在一起時，會帶來很多機會，可做的事情非常多。

量子位：從你們的角度看，當下AI技術的主要短板在哪裡？為何科研領域不能直接使用OpenAI或其他公司的模型？

陶哲軒：其實我們已經在嘗試使用一些主流LLM，也確實有研究者用它們產出了成果。

問題在於，模型會產生幻覺，這對科研而言是個非常嚴重的問題。科研需要可驗證、值得信任的系統。

另一個挑戰是可解釋性。模型有時會給出一個看起來不錯的想法，但它往往不會說明這個想法來自訓練資料中的既有文獻，還是某種新的組合，也無法說清它與已有工作的關係。

科學不只是解決一個個孤立的問題，更重要的是把新結果放進已有的知識體系中，讓後續研究者可以在此基礎上繼續推進。這就要求結果具備可追溯性、規範的引用，以及清楚說明如何擴展或修改。

商業化的大模型有時能做到這些，但並不穩定。如果我們能有專為科研設計的AI，或透過更好的工作流來強制驗證，並系統性地把結果與文獻體系連起來，對科學的幫助將大得多。

最終最可能的方向，是把現有模型嵌入到一個更嚴格的框架中，配合強有力的驗證與校驗機制，讓它們真正成為科學發現的工具。

Chuck：事實上，在日常層面，例如寫作，AI的表現已經不錯了。

但一旦進入更深、更專業的技術領域，情況就完全不同。許多細分科學領域，高品質、結構化的資料本身就非常有限。這也是為什麼必須與科學家緊密合作。

我們的目標是把這些系統打磨到可以可靠地用於科研。最終，我們希望讓先進的AI能被絕大多數人使用，也就是「AI普惠化」。

陶哲軒：我舉一個非常簡單的例子。

科學家在提出一個結論時，通常會同時說明自己對這個結論的信心程度，例如“我對此非常有把握”“我有一定把握”“這個想法目前還不太成熟”。

AI卻不會這樣做，它們幾乎總是用百分之百確定的語氣給出答案。如果AI能夠明確表達不同層級的置信度，它在科研中的實用性將提升很多。

量子位：現在整個產業的主線都在談Scaling，更多資料、更大的模型、更強的算力。但SAIR更關心「Scaling the Science of AI」，這到底是什麼意思？

陶哲軒：至今為止，科技公司所採取的路線確實非常成功。當算力和訓練資料提升一個數量級時，模型能力會有明顯的躍升。這套方法到目前為止效果仍然不錯。

但從長遠看，它會撞牆。資料不是無限的，公開互聯網基本已經被用得差不多了，同時還存在能源和算力等方面的限制。

另外，現在的AI能解決非常困難的問題，但往往非常低效。一位人類數學家可能只要看十個例子就能抓住問題的核心，然後舉一反三；而現有的AI通常需要數百萬個訓練樣本，還要反覆嘗試，甚至跑上百次，才能得到一個正確結果。

放到科研中來看，我們並不總是需要最大、最通用的模型。許多科研任務本身非常專門化。在某些情境下，體積更小、功耗更低、成本更低的模型，甚至能在個人電腦上運行，就已經足夠了。

大型公司更關注打造「什麼都能做」的通用模型；而科研情境，可能更需要為特定工作流量身定制的專用工具。開發與支援這類工具，正是我們希望透過SAIR去推動的一件事。

量子位：我能不能這樣理解，在AI x Science這個方向上，真正關鍵的是更好的原則和方法論，而不是一味把模型做得更大？

陶哲軒：可以這樣理解。我們需要更好的方式去評估可信度、表達置信水平，也需要提升系統的可解釋性。

我們同樣需要改進人類與AI協作的方式。現在最常見的交互模式是，你給模型一個提示，它直接給出一個完整答案。

但在很多科研情境中，研究者不僅關心最終結論，還希望看到推理過程本身。你可能想在中途介入，補充新的資訊，或探索不同的路徑。

目前不少研究者對AI的應用仍持觀望態度，一方面是因為親身經歷過系統出錯的情況，另一方面是現有工具與他們的核心研究需求不匹配。

如果科學家能夠開發真正貼合自身工作流和研究需求的工具，我認為這些系統的使用率將顯著提升。

Chuck：我想從另一個與可信度相關的角度補充一下，「資料品質」。

我們的一位密切合作夥伴John Hennessy，一直在為SAIR Foundation提供建議。他是圖靈獎得主，同時也是Alphabet的董事長。他經常強調，在科研中，提升資料品質的重要性不亞於提升模型本身。

信任本身也是一個更宏觀的社會問題。在不同地區，人們對資料和技術的信任程度不一樣。美國社會對一件事的信任水平大約在70%到80%之間，而對AIGC的信任度，往往只有這個數字的一半左右。

這種落差也解釋了為什麼許多組織，包括OpenAI、xAI以及其他AI公司，都希望與我們合作。信任、可靠性和科學嚴謹性至關重要。

量子位：隨著AI不斷降低科研門檻，會給整個產業，以及全球科研格局帶來哪些變化？

Chuck：這個問題很好。我認為最終的目標是，在與頂尖科學家、研究者一起合作的過程中，把AI提升到一個「預設值得信任」的水平。

一旦AI達到這樣的程度，它就不會只被專家使用。普通人也能放心使用，比如你的父母，甚至祖父祖母，都可以在日常生活中依賴AI，而不必擔心它靠不靠講。

這也正是我們為何要把一流的科學家和產業界的夥伴聚在一起，互相學習、共同推進。只有透過這樣的協作，技術本身以及它在真實科研情境中的應用，才能一起向前走。

我們希望AI能成為一種日常工具，就像汽車一樣。當AI達到這樣的可靠性水平時，全球科研格局才會真的發生變化。

量子位：SAIR具體會如何參與並推動這個轉變？

Chuck：我們的做法是，把學術界與產業界以更直接、更有組織的方式拉到一起。

在學術面，很多研究者缺乏算力，也很難獲得長期、穩定的資金支援；在產業面，公司擁有算力、資本和工程能力，但現有模型和工具與科研需求之間仍有明顯的錯位。

科研領域越來越需要更廣泛的社會力量參與進來，包括捐助者、基金會、投資人和創業者。把這些人聚在一起，能更好地支持那些真正長期、具有高影響力的研究方向。

我們相信，這種協作模式能把科學的邊界推得更遠。

陶哲軒：在過去的幾十年裡，一種主流模式是：學術界主要依賴官方資金支持，產業界則負責把研究成果轉化為應用。學術研究者提出基礎性的想法，產業界或其他主體再把這些想法變成知識產權、專利和商業產品。

這條鏈路能夠運作，但速度相對較慢。在一些國家裡，學術界並沒有動力去考慮市場化問題，而產業界也很少投入到真正長期、基礎性的研究，更關注短期回報。

我們可以重新思考，在21世紀，從基礎科學到應用研究，再到真實世界產品的這條路徑應該如何設計，怎樣才能更高效，也更貼合社會需求。

Chuck：這是一個非常特殊的歷史節點。過去，大學和科研機構可以依賴相對穩定的政府資助；現在，尤其是在美國，這種支持出現了變化，新的合作模式變得非常必要。

我們把這看作一個機會，各方都在探索新的資源整合模式，像SAIR這樣的組織也站了出來，支持傑出的研究者，並與產業夥伴緊密合作。

量子位：AI模型的品質在很大程度上取決於資料。你們覺得，在不同基礎科學領域裡，資料的多寡是否會導致AI落地難度的差異？

陶哲軒：AI在那些高品質資料比較充足的科學領域裡，進展往往最快。

一個很典型的例子就是蛋白質摺疊。這個領域經過數十年的持續投入，累積了大量經過精心整理的高品質蛋白質資料。

但在其他領域，情況就完全不同了。例如對單個細胞進行建模，乍看好像是相近的問題，但我們目前並沒有同等品質、同等規模的資料。

AI對資料的依賴程度非常高，遠超許多傳統科學方法，這是一個真實存在的瓶頸。

有人寄希望於用合成資料來取代真實資料，但如果生成方式不夠嚴謹、標準不夠高，可能會適得其反。低品質的合成資料會污染原有資料集。

Chuck：我完全同意，而且我也覺得，不同學科之間的難度差異非常大。

如果想在這些領域解決更難的問題，強大的基礎模型當然很重要。但正如Terry所說的，沒有高品質資料，再複雜的模型也會舉步維艰。

有一句老話叫「garbage in, garbage out」，在這裡體現得非常明顯。這也是為什麼AI x Science這樣的項目如此重要。

在2月10日的活動中，我們把來自不同學科、不同機構的一些頂尖學者聚到了一起。參與者包括來自UCLA、Berkeley、Caltech，以及美國和北美各地高校的研究者。

我們的主旨演講嘉賓中，還有一位最近獲得圖靈獎、同時也是強化學習領域的奠基者之一，理查德·薩頓。

我們也在促進跨地區研究者交流。推動AI x Science，離不開全球範圍內的共同參與。

量子位：SAIR具體如何支持科學家之間的跨學科、跨國家合作？

Chuck：IPAM（純粹與應用數學研究所）和UCLA其實在此方面已經做了很多年，而且做得非常好。IPAM長期以來都有組織跨學科主題專案和工作坊的傳統，時間跨度通常很長，參與領域也很廣。

我前不久去新加坡和馬來其實就是參加了由OpenMind組織的冬季學術營。OpenMind的創辦者正是圖靈獎得主理查德·薩頓，該組織主要面向來自世界各地的年輕研究者。

那次活動的參與者許多都來自亞洲，包括新加坡、馬來西亞、中國、菲律賓、韓國等地。大家聚在一起，交換想法，討論更高效的模型，一起思考AI接下來應該往哪裡走。

這種跨地區、跨學科的合作框架，與SAIR希望支持的方向高度一致。

陶哲軒：SAIR今年才剛剛起步，但IPAM已經運作了二十多年。

IPAM最具代表性的活動之一，是為期大約三個月的長期主題專案。在這些專案中，我們會邀請來自不同領域的學生、教師，有時也包括產業界的研究者，圍繞一個主題深入交流，比如心臟相關科學，或自動駕駛。

事實上，我在深度學習真正大規模興起之前，就已經舉辦過相關的研討會。

雖然IPAM並不是一個專門做AI的機構，但它舉辦了許多在AI相關方向上具有影響力的活動。核心理念就是把那些平時很少有機會交流的群體聚到一起，比如純數學家、應用數學家、物理學家、工程師，以及其他科學家。

過去，這種合作更多集中在學術內部。透過SAIR，我們希望把這種模式再往前推進一步，加強與產業界的連接，同時更關注一些中短期內能夠產生實際影響的應用。

我自己的背景仍然主要在數學，但現在我們也在更廣義地理解數學，把它放進一個連接理論、計算和現實影響的生態中。

我們希望嘗試新的形式，探索更多把不同社群聚在一起的可能性。

Chuck：IPAM和UCLA花了幾十年時間，打下了堅實的協作基礎，而透過SAIR，我們可以把這套模式在地區上、在學術與產業之間進一步擴展。

SAIR的核心目標是，基於已經行之有效的基礎，把它擴展成一個真正全球化、跨學科，並且緊密連接真實科學問題的合作網絡。

量子位：AI for Science的發展，會不會反过來影響今天產業界開發和使用AI的方式？它有沒有可能成為一條通向AGI的更優路徑？

陶哲軒：我覺得這是一個非常有前景的方向。

在數學和科學中，尤其是在數學裡，許多輸出是可以被形式化驗證的，這給了我們一種約束AI的方式。把AI放進一個可以驗證的環境中，這有助於減少幻覺。

如果我們能在數學或科學中，建立起可靠、可驗證的AI框架，這些原則是有可能推廣到其他領域的。

現在在醫學、金融等領域，完全信任AI仍然風險很高。你可以把它當作輔助工具，但在涉及生命安全或巨額資金時，很難放心地把控制權交給AI。

如果我們能先在科學領域解決可靠性和驗證的問題，之後這些成果就有機會遷移到更廣泛的應用中。

Chuck：以金融為例，大多數人並不願意把敏感的金融決策完全交給AI；醫學也是一樣，錯誤可能直接關係到生死。

因此，AI for Science，以及反过來的Science for AI，才顯得尤為重要。

如果我們能在科學環境中打造出真正值得信任的AI系統，我們希望這些進展可以在不久的將來，遷移到那些關鍵性應用場景中。

陶哲軒：沒錯。數學和科學為AI提供了一個非常安全的實驗場。

如果AI在醫療或金融情境中出錯，後果可能非常嚴重；但如果它算錯了一道數學題，最多就是再試一次，幾乎沒有損失。

這讓數學成為一個理想的環境，用來打磨可靠AI的系統。

Chuck：還有一個優勢在於，數學研究通常不需要像其他應用那樣消耗巨大的算力。這讓我們可以更高效地反覆實驗，用相對較低的成本探索新思路。

陶哲軒：這也是為什麼從這裡起步。藥物研發當然非常重要，但臨床試驗的成本極高、週期又很長，為了驗證一種AI方法就投入數十億美元是很難實現的。

相比之下，在數學中開發和測試AI，可以更快、更安全地驗證想法，再逐步走向那些高風險、高投入的領域。

量子位：有一種擔憂是，更高層次的研究能力，例如「品味」，本應建立在扎實的基礎訓練之上，但AI可能正在拆掉這些年輕研究者的成長階梯。你們怎麼看？

陶哲軒：現在，AI已經能完成過去屬於研究生或初級研究者訓練內容的工作，例如解一些標準問題、做實驗中的部分環節，或整理文獻。

這些事情越來越容易被自動化，於是會產生一種誘惑：既然AI更快，那乾脆全部讓AI來做。

但問題在於，這些看似重複、甚至有點枯燥的訓練，對人的成長非常重要。我自己，包括許多資深研究者的能力，很大一部份就來自這些初級工作。

所以必須有一個平衡。即便AI能做，我也必須有意識地為年輕研究者保留有價值的訓練過程。等一個人累積了足夠的經驗，例如親手做過一定數量的實驗之後，再逐步引入自動化。

Chuck：現在已經能看到一些過度依賴的趨勢。大家都知道AI並不能百分之百可信，但很多人仍會第一時間把問題丟給AI，直接要答案或建議，這其實會削弱獨立思考的能力。

這也是為什麼我們特別強調讓頂尖科學家參與進來。像Terry這樣的研究者，或其他諾貝爾獎級別的科學家，都是在沒有AI工具的時代接受過嚴格訓練的人。

透過建立一種類似「師徒制」的結構，讓經驗豐富的研究者與有潛力的年輕人緊密合作，能逐步形成更好的實踐方式、更好的模型，也包括更好的平台，在支持創新的同時，不犧牲學習本身。

陶哲軒：這裡其實也有一個很有意思的歷史類比。

計算器剛出現的時候，很多人擔心學生會由此不再學基本的算術了。

這種擔憂在某种程度上確實有道理，所以直到今天，我們仍然會先教孩子手算加減乘除，再讓他們用計算器。

但另一方面，計算器也極大地拓展了人們探索的空間。它讓人更容易去試驗數字、發現規律、探索原本很難觸及的想法。

工具本身並不會自動讓人變弱，它同樣可以激發探索與創造力。關鍵在於如何使用。

面對AI，我們也需要做出類似的判斷：什麼時候該用，什麼時候該克制，以及如何把它引入訓練體系，同時不削弱那些真正重要的核心能力。

量子位：隨著AI逐步取代很多現有的科研流程和技能，未來研究者最重要的能力和特質會是什麼？

陶哲軒：未來的科研將越來越多地以更大規模、更多元化的團隊形式展開。團隊裡可能既有學術研究者、產業研究人員、數學家和科學家，也會有AI系統和不同背景的人一起協作。

在此情境下，如何在大型團隊中高效合作，將成為一項非常重要的能力。

過去，人們常把科學描繪成「孤獨天才」的事業，但現實裡它早就是團隊合作，而且這種趨勢只會繼續加強。

溝通能力，以及我們常說的那些軟技能，將變得越來越重要。

在此背景下，「品味」非常關鍵。能夠形成整體判斷，識別哪些方向值得投入，再借助AI工具或其他合作者把想法展開，這種能力非常重要。

我們很可能會看到比過去更細膩的分工。

傳統上，尤其是在數學領域，工作方式幾百年幾乎沒什麼變，有時甚至帶點「中世紀風格」。一個人要同時負責檢查細節、做計算、發展想法、寫論文、申請經費，然後去做報告。

但在未來，大型專案會由很多人共同完成。有人負責長期願景，有人擅長與AI工具深度協作，有人負責團隊協調，有人負責把它講給更多人聽。

能為數學和科學做出貢獻的能力類型，將變得豐富得多。

Chuck：我經常半開玩笑地說自己是個「立志當科學家的人」，很大程度上是因為我有機會和像Terry這樣的傑出科學家、數學家長期合作。

我的背景並不在科研，而更多在商業領域。但我聽過一些非常成功、打造過數十億美元公司的人說過，他們見過最優秀的一些prompt工程師，背景並不是工程或計算機，而是會計、法律。

這恰恰說明，未來的科研將變得更加開放。借助AI和新的工具，來自完全不同背景的人，都有機會以有意義的方式參與科研。這也是我們所謂的「科學和AI普惠化」的重要內涵之一。

陶哲軒：我目前參與的許多項目，以及SAIR希望支持的方向，本身就已經是高度協作的。它們通常匯集了職業數學家、學生、其他學科的研究者，有時甚至還包括公眾參與者。

隨著AI和相關工具的發展，從事嚴肅科學和數學研究的門檻正在降低。這正是此次技術變革中，最令人興奮的一點。

量子位：那是不是意味著，未來連我還在讀國中的弟弟，都有可能在《Nature》上發表論文？

陶哲軒：這是有可能的（笑）。

未來可能會有論文擁有成千上萬名作者，每個人都貢獻其中的一小塊，但都是真實、有價值的貢獻。從這個意義上說，非常年輕的人參與其中，並不是不可能。

事實上，在數學領域已經出現過這樣的例子：有青少年在AI的幫助下，為某個已知問題找到了新的解法。它未必是最重大的突破，但確實是新的結果。

這種情況未來會變得更普遍，但目前還很難說，唯一的辦法就是繼續嘗試、不斷探索不同的研究方式。

Chuck：我其實非常希望能看到那樣的場景。在過去，如果你沒有很強的STEM或工程背景，幾乎不可能直接參與前沿科研。

如果來自非傳統背景的人，也能以有意義的方式參與科研，並真正對世界產生正面影響，那就是一件非常了不起的事情。

量子位：結合我們前面的討論，你們能不能舉一些更具體的例子，說說SAIR未來將如何支持年輕研究者的成長？

Chuck：這是個特別好的問題，說實話，這也是我個人非常投入的一件事。我多年來一直在做與導師制相關的工作，從大學階段就開始了。

從我的觀察來看，培養年輕研究者，最重要的一點是樹立榜樣。

人在不同階段，都會尋找榜樣。小時候，在家裡看父母；進了學校，看老師；再往後，就會把目光投向更廣闊的社會。

這也是為什麼我們如此重視把不同領域的傑出科學家聚在一起。每一位創始成員，成功的路徑都不一樣。

Barry Barish的科研經歷非常具有代表性。愛因斯坦在早期論文中就預測了引力波的存在，但從提出這個理論，到實驗上真的觀測到引力波，中間走了將近一百年。

但直到2016年前後，人類才首次探測到引力波，Barry Barish也因此在2017年獲得諾貝爾獎，目前Barry Barish也是SAIR諮詢委員會的創始成員。這個例子很好地闡釋了什麼叫幾十年如一日。

這些傑出科學家的價值，不只在於他們的成果，也在於他們能夠分享自己在不確定性、挫折與失敗中是如何堅持下來的。這是導師制中非常重要的一部分。

年輕科學家並不缺天賦，只是剛剛起步。所以我才會如此重視和Terry，以及整個創始團隊一起做這件事，因為現在最需要支持的，恰恰就是這些年輕人。

Terry是獨一無二的，但如果借助AI和更好的培養渠道，未來能不能不只有一個陶哲軒，而是一萬個陶哲軒？！這難道不是件非常令人興奮的事嗎？！

陶哲軒：是的。SAIR只是眾多嘗試中的一種，它不可能包辦所有事情。支持下一代研究者的需求非常廣泛，沒有任何單一組織能獨立完成培養整個科研隊伍的任務。SAIR能做的，是專注於少數有針對性的項目。

以IPAM為例，我們可以支持暑期學校、研習班，以及面向公眾的科普和交流活動。一些協作式、眾包式的研究項目，本身就會自然地吸引年輕研究者參與，有些情況下，他們甚至可以擔任領導角色。

我們希望，SAIR能對其他組織產生啟發，讓更多機構也願意站出來，在支持下一代科研人才這件事上承擔起重要責任。

陶哲軒如何使用AI？

量子位：接下來我想把話題轉到數學上。Terry，您最近在做什麼？有沒有哪些方向是您現在特別感興趣的？

陶哲軒：我現在大概有一半時間，仍然花在比較傳統的純數學研究上，也就是我過去23年來一直在做的那類工作。比如研究數字中的模式，理解高度結構化、週期性的函數和非常隨機的函數之間有什麼本質差異，以及研究一些偏微分方程，比如來自流體力學的方程。

不過在這些方向上，我現在越來越多地把一些最前沿、最技術性的進展交給更年輕的合作者來完成。相應地，我自己研究中的一個越來越重要的部分，開始與新技術產生關係，尤其是「如何做數學」「如何協作做數學」的新方式。

我目前非常感興趣的一個方向是形式化，也就是不再只依賴紙筆證明，而是把數學寫成電腦可以理解和自動驗證的形式化語言。這將深刻改變協作方式。它不僅讓我們可以和AI系統一起工作，也讓我們能夠和許多不認識的研究者協作。

在過去，如果一個陌生人給你發來一份證明，你很可能會對它是否正確保持懷疑；但如果這份數學內容是用可形式化驗證的語言寫成的，這種擔憂基本就不存在了。

借助這些方法，我們已經能在一些項目中實現數十人的協作，有時甚至五十人以上，而且其中很多人彼此從未見過面。大家可以一起解決那種單靠個人幾乎不可能完成的大問題。

我們也在嘗試把AI當作證明助手來使用，同時借鑒現代軟體工程裡的許多理念，例如使用GitHub做版本控制、進行單元測試、做品質檢查等等。

從某種意義上說，我正在學習軟體工程的工具，並把它們引入到一種可以稱為「數學工程」的實踐中。

對我來說，這一切更像是一系列實驗。並不是每一次嘗試都會成功，但即便弄清楚什麼行不通，本身也很有價值。

量子位：感覺您一直都很願意把新技術引入自己的研究流程。距離您上一次接受Lex Fridman採訪已經過去半年了，這段時間裡，您對AI的看法有變化嗎？

陶哲軒：總體來看，變化不大。但有一點出乎我意料，AI在數學方向上的進展，比我原先預期的要快一些，當然，距離真正成熟還有很長的路要走。

變化更明顯的，其實是整個學術社區的態度。我開始看到越來越多的同事接受這樣的一個事實：AI不會消失，它會長期存在下去。大家對嘗試不同使用方式的開放度，也明顯提高了。

不過，現在仍然缺少一個被廣泛理解和認可的中間態。很多時候，感覺只有兩個極端選擇：要么幾乎什麼都用AI，要么就完全不用。

真正理想的情況，應該是混合式工作流——大部分研究仍然用傳統方式完成，但把某些環節有意識、有控制地交給AI。目前我們還沒有真的找到那個最合適的平衡點。

我經常拿網際網路來類比。網際網路非常有用，但我們不會用它來做所有事情。我們仍然會選擇線下見朋友，而不是永遠開視訊會議；但在某些情況下，比如現在這樣的對話，網際網路又恰到好處。

經過多年，我們逐漸學會了什麼時候、怎麼用好網際網路。我想，對AI來說，我們仍在摸索這種平衡的過程中。

量子位：Terry，您是世界頂尖的數學家之一，也和許多一流數學家長期合作。你們在日常研究中，具體是怎麼使用AI的？

陶哲軒：其實挺日常的。我主要把AI用在一些偏輔助性的事情上。比如做文獻檢索，如果我一時想不起某個數學結論的具體形式，或者它和另一個結果之間的關係，我就直接問AI。再比如需要快速畫個圖、做個簡單的可視化，也會讓AI來幫忙。

在和文字相關的工作上，我用得更多。寫作時我幾乎一直開著自動補全。有時我會先把一篇論文的結構分成五步，自己寫完前兩步，後面幾步就讓AI幫我起草一下。

以至於現在，如果我在飛機上、沒法用AI寫東西，偶爾還會下意識地想：「怎麼還不幫我把這句話補完」，然後才反應過來AI不在。

如果有人給我發來一段很長的論證，或者一篇論文，我也常常先讓AI幫我總結一次。在這些方面，它確實是一個非常好用的工具。

但在真正做深度思考的時候，比如我在努力解決一個很難的研究問題時，我基本不會用AI。這種時候我仍然更依賴紙和筆。

我也嘗試過直接和AI一起推研究層級的問題，但目前的體驗並不理想。它給出的建議往往比較套路，有時還會打斷我的思路。不過，在圍繞科研的那些輔助環節上，AI已經變得非常有價值了。

量子位：過去一年里，有沒有出現什麼新的Aha-Moment？

陶哲軒：有的，通常是在一個問題上想了好幾個月，有一天突然意識到：「哦，原來這麼簡單，我怎麼之前沒想到？」

在這之前，你往往已經試過很多條路，有時八種、九種方法，全都走不通。但正是這些失敗的嘗試，一步步把不可能的方向排除掉，最後只剩下一條真正可行的路。等你終於看到那條路時，回頭看就會覺得它顯而易見。

這種時刻常常伴隨著一種錯覺，好像之前那些嘗試都是在浪費時間。但事實上，正是不斷試錯、不斷排除，才讓你真正理解什麼方向行得通。我自己的數學「頓悟」，到目前為止基本還是這樣產生的。

AI目前還無法重現這個過程。它確實能提出很多想法，但這些想法往往顯得比較隨機，也看不出它能像人一樣，從失敗中逐步學習、調整方向。到目前為止，我還沒有真正用AI來直接解決研究層級的難題。

不過，只要我已經有了清晰的思路或解法，AI就會變得非常有用。它可以幫我把結果寫出來、與已有文獻建立關係、生成程式碼，或在某些數學環節上提供計算支援。

從這個意義上說，它非常有價值，但更多是一種互補工具。它在支援我的工作，而不是取代我最在意的那一部分。

我覺得總體來說，人們更傾向於把AI用在自己不太享受的那些任務上，而把真正喜歡做的部分留給自己。對我來說，數學問題本身就是我最享受的事情，這也是我做數學的核心動力，所以這部分我仍會親自來。

但有些事情，我就非常樂意交給AI。比如在文獻中查找，有沒有人以前用過類似的方法，或者在成百上千篇論文裡篩選出相關工作，這對我來說就是一個非常理想的AI使用場景。再比如一些又長又繁瑣的計算，也非常適合交給AI。

當然，這件事因人而異。不同研究者享受的環節不一樣，而AI本身又是一個非常寬闊的工具。對一個人來說特別有用的功能，對另一個人來說可能就沒那麼重要。所以也談不上什麼「最好的模型」或「標準工作流」。

關鍵還是看你希望AI幫你做什麼，以及你更願意把哪些事情留給自己來完成。

量子位：數學曾經從其他學科中汲取養分。這次，數學已經從AI身上學到了什麼，或是未來可能會學到什麼？

陶哲軒：有一件事我自己正在大量學習，那就是軟體開發。

未來的數學，可能會越來越像今天的軟體開發。

如果回到五六十年前，軟體往往是由一個人獨立完成的：一個人寫程式碼、測試、除錯，所有事情都自己來。

但今天，軟體開發已經變成了一個成熟的產業。有人專門寫程式碼，有人負責UI，有人負責品質控制，還有一整套成熟的工作流、工具和最佳實踐，还有大量踩坑經驗。

數學正在開始向這種模式學習，包括它成功的地方，也包括它失敗過的地方。

傳統上，數學和物理的聯繫非常緊密。但現在，我們越來越多地和生命科學、社會科學等領域發生互動。這些領域的問題往往更複雜、更雜亂，方程沒有物理裡那麼乾淨，而且對資料的依賴也強得多。

從這個角度看，AI可能非常適合處理這類複雜、嘈雜、不那麼容易被形式化的問題。

我覺得，我們正在進入一個更加跨學科的時代。數學不再只是和物理對話，而是幾乎所有學科都在彼此交流，而AI正是推動這種跨學科互動的重要力量之一。

量子位：所以你現在也算是在「做軟體」了，對吧？

陶哲軒：從某種意義上來說是這樣。我現在參與的項目不少，但越來越多時，我更像是在做項目管理。真正去證明定理的，往往是其他合作者，而我更多是在協調整體工作，把不同部分拼接起來。

這是一個挺有趣的角色。在一些項目裡，我並不是主要的「解題者」，而是負責組織、推動，讓每個人都能把自己的能力發揮到最好。證明這樣的方式在科研中也可以運作得相當不錯。

量子位：AI不僅降低了做數學的門檻，看起來也在降低你剛才提到的許多其他領域的門檻，比如編程、物理和醫學。AI有沒有促使你對其他學科產生興趣？

陶哲軒：非常明顯。有一件事讓我自己都覺得意外的是，我現在合作的人，背景比以前多樣得多。

十年前，我幾乎只和數學家合作，偶爾會和統計學家或電子工程師一起做點事情，也就到此為止了。

但現在，我在和來自各個領域的人合作，尤其是產業界的人，比如Chuck這樣的夥伴。真的有一種感覺，大家都開始彼此對話了，而且在此過程中互相學習。

其他學科的研究者，往往能從更偏數學的思考方式中受益；而數學家也能從更貼近現實世界的視角中學到很多東西。

之所以能做到這一點，很大程度上是因為我們現在有了很多工具，其中不少是由AI驅動的，它們幫助我們理解彼此的語言和工作方式，讓合作變得更順暢、更高效。

我覺得這是當下這個階段真正令人興奮的地方之一：學科之間的壁壘正在降低，我們開始學會用過去很難實現的方式一起工作。

量子位：和背景差異很大的人一起工作，感覺怎麼樣？

陶哲軒：我其實非常享受這種狀態。當然，我也想先說清楚一點：深度領域專家永遠都有不可替代的位置。那種在非常狹窄的子領域裡做到世界頂尖的人，我們依然非常需要，這一點並沒有改變。

變化在於，這些專家現在可以和另一類人更緊密地合作，他們或許不專精於某一個具體領域，但擅長把不同學科的想法串聯起來，看到整體圖景。

這幾年裡，我自己學到了很多原本完全不在我訓練範圍內的東西，比如生物學、經濟學、政策、科研資助機制等等。有些內容確實出乎意料，有時也稍有挑戰性。

但我也發現，數學裡的一些核心觀念，能以很自然的方式遷移到其他領域，特別是關於驗證、嚴謹性和清晰思考的一套方法。

對我來說，這是一段持續學習的過程，而且我真的很享受。我相信，在新的科研環境裡，那些願意保持開放心態、樂於跨學科溝通、也不怕學習新「語言」的人，更容易如魚得水。

Chuck：Terry剛才說的，其實正好呼應了我們之前聊到的「技術普惠化」，尤其是AI。借助現在的技術，也包括SAIR在做的事情，我們正在把來自非常不同領域的一流人才聚到一起。

當你擁有這樣的一個網絡時，事情會變得容易許多。不僅更容易發現真正具有挑戰性的問題，也更容易迅速判斷，誰是最適合來解決這些問題的人。有時，這些人手裡已經有一部分答案；有時，他們能立刻把你引薦給更合適的合作者。

在我看来，這種高效連接問題與人才的能力，就是「AI普惠化」在現實中的一個非常具體的體現。

陶哲軒：從傳統上看，科研往往是围绕学科来组织的，比如數學系、物理系、經濟系等等。這種結構自然會讓數學家主要和數學家交流，物理學家主要和物理學家交流，真正的跨學科合作並不常見。

我對SAIR抱有期待的一點在於，它在一開始就刻意聚集了一群背景和興趣都非常多元的人。這種設計本身，就更容易促成一些在傳統體系裡不太容易出現的連接。

透過降低制度層面和學科層面的壁壘，我們有機會推動那些原本很難發生的合作。

AI時代，高校需要新的培養方式

量子位：Terry，你剛才提到傳統高等教育，正好也是我接下來想聊的话题。Chuck，在AI時代，你覺得哪些能力對大學生更重要？

Chuck：這些年我做過不少學生的導師。我的感受是，即便是博士生，真正長期、密切合作的導師數量也很有限，通常三到五位，多一点可能也就十位左右。這其實會限制他們接觸到的視角範圍。

但現在情況正在發生變化，特別是在AI x Science這樣的方向上。我們可以更容易地把不同類型的專業能力匯聚到一起。這類問題天然是跨學科的，而AI讓來自不同背景的大規模協作變得可行。

在此環境下，有一項能力會變得格外重要，那就是批判性思維。很多人喜歡談「提示詞工程」，但在我看来，提示詞工程本質上就是另一種形式的批判性思維。

你必須清楚自己要解決什麼問題，如何把問題表述清楚，以及你真正想要什麼樣的答案。如果這些想不明白，其實AI也幫不了你太多。

所以，清晰思考、提出好問題、抓住問題核心，這些能力仍然非常關鍵。

與此同時，AI也在降低非傳統STEM背景人群的參與門檻。我自己就是一個例子，我沒有接受過系統的科研訓練，背景更多在商業領域。

但借助AI，我依然可以有意義地參與科學討論，理解一些核心思想，並做出貢獻。這種體驗非常有力量。

未來並不只是STEM和非STEM的區分，而是讓不同技能結構的人，用不同方式參與進來。這正是AI x Science和SAIR如此重要的原因。

陶哲軒：事實上，對科學感興趣、希望參與其中的人，遠遠多於接受過正式科研訓練的人。而AI正好擴大了能夠參與科研的人群範圍。

未來的科學發展，並不只取決於技術能力，儘管技術仍然重要。組織能力、溝通能力、與他人協作的能力，正在變得越來越有價值。

但同時，是否具備整體視野，知道哪些問題值得投入精力，以及什麼時候該用技術、什麼時候該克制，這也非常重要。

量子位：現有的大學體系已經存在了很長時間。如今有了AI，很多人都覺得一場大的變革正在到來。你們覺得高等教育應該如何去適應？

陶哲軒：這是個非常棘手的問題。坦白說，我希望我們能有更多時間，來慢慢想清楚這些事。但現實是，我們只能「邊走邊想」。

已經能看到一些令人擔憂的現象。有些學生過度依賴AI，成績看起來很好，但實際上學到的東西並不多。

也有一些學生堅持完全用傳統方式學習，幾乎不用AI。他們往往理解得更扎實，但在效率和結果上，可能又會落後於那些大量使用工具的同學。

所以，明顯需要重新找一個平衡點。學校必須教會學生如何負責任地使用AI，也要讓他們知道在什麼時候不該用。

我認為，未來會更多地轉向小組項目和協作式學習，這本身也更貼近科研和產業的真實形態。

另外，課程之間可能需要更緊密地整合。現在的教育體系，往往把知識拆分成一個個相對孤立的專業模組。將來，也許需要一種更整體的結構，更強調通用的問題解決能力。

過去，學生是在作業、考試、以及和難題死磕的過程中，慢慢學會如何學習、如何面對失敗、如何承受壓力的。到目前為止，我們還沒有為這些能力找到一個結構清晰、系統性的替代方案。

大學眼下不得不被許多現實的問題牽著走，比如維持日常運轉、保障研究生經費、平衡預算等等，很難真正停下來，從零開始重新設計教育體系。

從歷史上看，我們也並不是第一次面對這種衝擊。電腦普及的時候，教育變過一次；網際網路出現後，又變過一次；維基百科剛出現時，也有一段時間，學生直接複製貼上內容交作業。

後來大家發現，解決辦法並不是完全禁止新技術，而是教學生如何正確使用它，把它當作起點，而不是終點。

我認為AI也是類似的情況。它可以成為探索和研究的一個起點，但不能取代思考本身。學生不能只是向AI要一個答案，貼上作業裡。

高等教育真正的挑戰，就在於如何找到那個平衡點：一方面充分發揮AI的優勢，另一方面又不犧牲深度學習和真正的智力成長。

Chuck：產業界的變化往往比學術界要快。在AI時代，這個差距變得越來越清晰。而這正是SAIR Foundation看到的機會所在——把學術界和產業界拉到一起，讓雙方相互學習。

從我和創業者打交道的經驗來看，他們有一個非常共同的特質：強烈的問題導向。不管問題有多難，他們都會盯著「怎麼解決」，並願意因此付出一切努力。

這種心態，是我希望高等教育能夠更多吸收的，尤其是在AI已經成為核心工具的背景下。大學的培養模式應該隨之調整，讓學生學會如何用AI去解決真實世界的問題，而不只是掌握一塊塊割裂的知識。

還有一個繞不開的大問題是成本。在許多發達國家，尤其是美國，高等教育極其昂貴。一些頂尖大學，一年的學費加相關費用接近10萬美元，四年下來就是40萬美元。

如果這種趨勢繼續下去，特別是在AI已經提供了獲取知識和技能的新路徑之後，人們自然會開始質疑：大學學位到底還值不值得？

這也是為什麼，讓教育與產業更緊密地對齊變得如此重要。我們需要更清楚地知道，社會真正需要什麼能力，以及大學該如何調整自身的培養方式來回應這些需求。

在接下來的一系列項目中，我們會把產業界和高等教育的負責人同時請到一起。我們正在組織一些圓桌討論，邀請來自賓夕法尼亞大學、南加州大學、UCLA等高校的代表，坦誠地討論課程體系和培養模式應該如何演進，以應對這些挑戰。

另外，我對像OpenMind這樣的組織印象很深。我們也在思考，是否可以做類似的實驗。透過SAIR，聯合IPAM和UCLA，我們正在探索舉辦更密集的項目，比如暑期學校。

這種形式的好處在於，它能讓我們更快地迭代課程內容，不必受制於傳統學期制度，同時也更貼合AI發展本身的節奏。

量子位：最後一個問題。Terry，如果未來真的實現了AGI，它的數學能力全面超過人類，我們還有必要學數學嗎？

陶哲軒：AGI本身其實是一個非常模糊的概念，不同的人對它的理解差異很大。

我舉個例子，交通工具。過去，人們靠走路、騎馬出行；之後有了汽車和飛機，效率遠遠高於步行。但我們並沒有因此就不走路了，不是因為必須這麼做，而是因為喜歡，或者因為這對身體有益。

科學和數學將來也可能是類似的情況。即便有一天，借助AGI，科學發現的速度遠遠快於人類單獨完成的速度，人們依然會想親自去做科學、做數學。

它可能會更多地變成一種手藝、一種愛好，或者一種出於興趣、好奇心和自我滿足的智力活動。

同時我也相信，無論AI變得多么強大，人類都會以不同於機器的方式繼續創造價值。

人類學習和推理的方式，與AI非常不同。AI可以通過海量資料和計算得出結論；而人類有時卻能在極少的資料、極低的計算量下，做出相當不錯的判斷。這種能力，很可能在未來依然重要。

科學的規模和方式，可能會發生巨大的變化。今天，一個研究者通常一次只解決一個問題；未來，或許可以同時推進成千上萬、甚至上百萬個問題。由人類把握少數關鍵方向，AI來填補其餘部分。

我們目前還沒到那一步，但這是一個合理的演進方向。即便在那樣的未來，學習數學依然有意義，只是它的角色和目的，可能會和今天非常不同。

量子位專訪陶哲軒：我為何現在創辦一個 AI x Science 組織

AI X Science需要自己的垂直AI

陶哲軒如何使用AI？

AI時代，高校需要新的培養方式

相關文章推薦

分享網址