Jay 發自 凹非寺 量子位 | 公眾號 QbitAI
數學家陶哲軒,公開了他的AI新身份——
SAIR Foundation 聯合創始人。
之前,他是舉世聞名的數學天才,年少成名的傳奇數學家、13歲加冕IMO最年輕金牌得主……24歲就成為加州大學洛杉磶分校(UCLA)史上最年轻的終身正教授。
最近幾年,隨著ChatGPT爆紅,他也成為了AI×數學的旗幟性人物,並開始更頻繁地思考和討論AI與基礎科學交叉的可能性。
而在2026年剛剛開年,50歲的陶哲軒再進一步,以聯合創始人的身份發起SAIR Foundation,希望這個旨在重塑AI與科學關係的非營利聯盟,能夠連接學術界和產業界,並團結並幫助更多年輕科學家共同推進兩大目標:
一、用科學的方法打造AI;二、借助AI重塑基礎科學研究。
△ SAIR Foundation主要專家成員
在SAIR Foundation對外官宣後,陶哲軒和Chuck NG——SAIR的兩位聯創,也在量子位的獨家專訪中,談論了他們關於AI x Science、數學、基礎科研等等相關的一切。
在他們看來,AI x Science最令人興奮的地方,在於科研的普惠化。他們希望透過SAIR這座橋樑,能讓更多年輕人打開象牙塔的大門。
未來,世界上可能會有一萬個陶哲軒。
上面這些只是冰山一角。在此次超過90分鐘的深度對談中,你還會看到以下精彩觀點:
如果AI在回答時能表達置信度,例如“我比較有把握”或“這裡不太確定”,其實際可用性將大幅提升。
學術界與產業界各司其職的模式走不通,速度太慢了,AI時代需要兩者緊密合作。
相比金融和醫療,科學是一個更安全的AI實驗場,相較之下,算錯一道數學題幾乎沒有任何損失。
看似重複、枯燥的基礎性工作,其實對人的成長非常重要,年輕人需要這些寶貴的訓練機會。
大部分學科都在彼此交流,而AI正是促成這種跨學科互動的重要催化劑。
不要簡單禁止新技術,高校的任務是教會學生如何正確使用它。
需要解決科研體系的結構性瓶須,透過跨學科的全球協作,以科學、安全的方式加速通用人工智慧(AGI)和超級人工智慧(ASI)的演進。
下面附上經校對後的完整訪談文字,全文超過1.5萬字。為了提升可讀性,量子位在不改變原意的前提下,對內容進行了適當的整理與刪減。
請享用。
AI X Science需要自己的垂直AI
量子位:首先,祝賀SAIR Foundation成立。能否和我們聊聊發起這個AI x Science機構的動機?
陶哲軒:我相信AI將從根本上改變科研模式,而我們首先要釐清的核心問題是:如何在科研情境中合理、高效地運用AI?
事實上,我們需要一些高品質的試點計畫,來展示什麼是最佳實踐,讓其他科學家可以參考、學習。
過去,這類工作主要由大學、科研機構和政府部門推動。但在當前環境下,來自其他領域的同樣重要。它更具彈性,能幫助我們嘗試一些創新性的事。
我很高興能參與創立這個機構,希望透過此途徑探索新想法,嘗試更大膽的路徑,看看當AI與科學以更審慎的方式結合時,究竟能走多遠。
Chuck:我一直都很享受與優秀科學家合作,能與Terry(陶哲軒)一起發起這個組織,我真的非常興奮。同時還有多位諾貝爾獎和圖靈獎得主一起加入。
Terry剛才更多談了學術面,而我自己長期推動學術與產業融合發展,這也是我們對此項目格外熱忱的原因之一。
如果你看看我們的啟動活動,會發現,參與者匯聚了全球頂尖學術研究者及多家科技領域企業代表,包括NVIDIA、OpenAI、Amazon、Microsoft等,各方圍繞AI x Science的發展展開交流探討,為後續跨領域協作奠定基礎。
當學術界與產業界坐在一起時,會帶來很多機會,可做的事情非常多。
量子位:從你們的角度看,當下AI技術的主要短板在哪裡?為何科研領域不能直接使用OpenAI或其他公司的模型?
陶哲軒:其實我們已經在嘗試使用一些主流LLM,也確實有研究者用它們產出了成果。
問題在於,模型會產生幻覺,這對科研而言是個非常嚴重的問題。科研需要可驗證、值得信任的系統。
另一個挑戰是可解釋性。模型有時會給出一個看起來不錯的想法,但它往往不會說明這個想法來自訓練資料中的既有文獻,還是某種新的組合,也無法說清它與已有工作的關係。
科學不只是解決一個個孤立的問題,更重要的是把新結果放進已有的知識體系中,讓後續研究者可以在此基礎上繼續推進。這就要求結果具備可追溯性、規範的引用,以及清楚說明如何擴展或修改。
商業化的大模型有時能做到這些,但並不穩定。如果我們能有專為科研設計的AI,或透過更好的工作流來強制驗證,並系統性地把結果與文獻體系連起來,對科學的幫助將大得多。
最終最可能的方向,是把現有模型嵌入到一個更嚴格的框架中,配合強有力的驗證與校驗機制,讓它們真正成為科學發現的工具。
Chuck:事實上,在日常層面,例如寫作,AI的表現已經不錯了。
但一旦進入更深、更專業的技術領域,情況就完全不同。許多細分科學領域,高品質、結構化的資料本身就非常有限。這也是為什麼必須與科學家緊密合作。
我們的目標是把這些系統打磨到可以可靠地用於科研。最終,我們希望讓先進的AI能被絕大多數人使用,也就是「AI普惠化」。
陶哲軒:我舉一個非常簡單的例子。
科學家在提出一個結論時,通常會同時說明自己對這個結論的信心程度,例如“我對此非常有把握”“我有一定把握”“這個想法目前還不太成熟”。
AI卻不會這樣做,它們幾乎總是用百分之百確定的語氣給出答案。如果AI能夠明確表達不同層級的置信度,它在科研中的實用性將提升很多。
量子位:現在整個產業的主線都在談Scaling,更多資料、更大的模型、更強的算力。但SAIR更關心「Scaling the Science of AI」,這到底是什麼意思?
陶哲軒:至今為止,科技公司所採取的路線確實非常成功。當算力和訓練資料提升一個數量級時,模型能力會有明顯的躍升。這套方法到目前為止效果仍然不錯。
但從長遠看,它會撞牆。資料不是無限的,公開互聯網基本已經被用得差不多了,同時還存在能源和算力等方面的限制。
另外,現在的AI能解決非常困難的問題,但往往非常低效。一位人類數學家可能只要看十個例子就能抓住問題的核心,然後舉一反三;而現有的AI通常需要數百萬個訓練樣本,還要反覆嘗試,甚至跑上百次,才能得到一個正確結果。
放到科研中來看,我們並不總是需要最大、最通用的模型。許多科研任務本身非常專門化。在某些情境下,體積更小、功耗更低、成本更低的模型,甚至能在個人電腦上運行,就已經足夠了。
大型公司更關注打造「什麼都能做」的通用模型;而科研情境,可能更需要為特定工作流量身定制的專用工具。開發與支援這類工具,正是我們希望透過SAIR去推動的一件事。
量子位:我能不能這樣理解,在AI x Science這個方向上,真正關鍵的是更好的原則和方法論,而不是一味把模型做得更大?
陶哲軒:可以這樣理解。我們需要更好的方式去評估可信度、表達置信水平,也需要提升系統的可解釋性。
我們同樣需要改進人類與AI協作的方式。現在最常見的交互模式是,你給模型一個提示,它直接給出一個完整答案。
但在很多科研情境中,研究者不僅關心最終結論,還希望看到推理過程本身。你可能想在中途介入,補充新的資訊,或探索不同的路徑。
目前不少研究者對AI的應用仍持觀望態度,一方面是因為親身經歷過系統出錯的情況,另一方面是現有工具與他們的核心研究需求不匹配。
如果科學家能夠開發真正貼合自身工作流和研究需求的工具,我認為這些系統的使用率將顯著提升。
Chuck:我想從另一個與可信度相關的角度補充一下,「資料品質」。
我們的一位密切合作夥伴John Hennessy,一直在為SAIR Foundation提供建議。他是圖靈獎得主,同時也是Alphabet的董事長。他經常強調,在科研中,提升資料品質的重要性不亞於提升模型本身。
信任本身也是一個更宏觀的社會問題。在不同地區,人們對資料和技術的信任程度不一樣。美國社會對一件事的信任水平大約在70%到80%之間,而對AIGC的信任度,往往只有這個數字的一半左右。
這種落差也解釋了為什麼許多組織,包括OpenAI、xAI以及其他AI公司,都希望與我們合作。信任、可靠性和科學嚴謹性至關重要。
量子位:隨著AI不斷降低科研門檻,會給整個產業,以及全球科研格局帶來哪些變化?
Chuck:這個問題很好。我認為最終的目標是,在與頂尖科學家、研究者一起合作的過程中,把AI提升到一個「預設值得信任」的水平。
一旦AI達到這樣的程度,它就不會只被專家使用。普通人也能放心使用,比如你的父母,甚至祖父祖母,都可以在日常生活中依賴AI,而不必擔心它靠不靠講。
這也正是我們為何要把一流的科學家和產業界的夥伴聚在一起,互相學習、共同推進。只有透過這樣的協作,技術本身以及它在真實科研情境中的應用,才能一起向前走。
我們希望AI能成為一種日常工具,就像汽車一樣。當AI達到這樣的可靠性水平時,全球科研格局才會真的發生變化。
量子位:SAIR具體會如何參與並推動這個轉變?
Chuck:我們的做法是,把學術界與產業界以更直接、更有組織的方式拉到一起。
在學術面,很多研究者缺乏算力,也很難獲得長期、穩定的資金支援;在產業面,公司擁有算力、資本和工程能力,但現有模型和工具與科研需求之間仍有明顯的錯位。
科研領域越來越需要更廣泛的社會力量參與進來,包括捐助者、基金會、投資人和創業者。把這些人聚在一起,能更好地支持那些真正長期、具有高影響力的研究方向。
我們相信,這種協作模式能把科學的邊界推得更遠。
陶哲軒:在過去的幾十年裡,一種主流模式是:學術界主要依賴官方資金支持,產業界則負責把研究成果轉化為應用。學術研究者提出基礎性的想法,產業界或其他主體再把這些想法變成知識產權、專利和商業產品。
這條鏈路能夠運作,但速度相對較慢。在一些國家裡,學術界並沒有動力去考慮市場化問題,而產業界也很少投入到真正長期、基礎性的研究,更關注短期回報。
我們可以重新思考,在21世紀,從基礎科學到應用研究,再到真實世界產品的這條路徑應該如何設計,怎樣才能更高效,也更貼合社會需求。
Chuck:這是一個非常特殊的歷史節點。過去,大學和科研機構可以依賴相對穩定的政府資助;現在,尤其是在美國,這種支持出現了變化,新的合作模式變得非常必要。
我們把這看作一個機會,各方都在探索新的資源整合模式,像SAIR這樣的組織也站了出來,支持傑出的研究者,並與產業夥伴緊密合作。
量子位:AI模型的品質在很大程度上取決於資料。你們覺得,在不同基礎科學領域裡,資料的多寡是否會導致AI落地難度的差異?
陶哲軒:AI在那些高品質資料比較充足的科學領域裡,進展往往最快。
一個很典型的例子就是蛋白質摺疊。這個領域經過數十年的持續投入,累積了大量經過精心整理的高品質蛋白質資料。
但在其他領域,情況就完全不同了。例如對單個細胞進行建模,乍看好像是相近的問題,但我們目前並沒有同等品質、同等規模的資料。
AI對資料的依賴程度非常高,遠超許多傳統科學方法,這是一個真實存在的瓶頸。
有人寄希望於用合成資料來取代真實資料,但如果生成方式不夠嚴謹、標準不夠高,可能會適得其反。低品質的合成資料會污染原有資料集。
Chuck:我完全同意,而且我也覺得,不同學科之間的難度差異非常大。
如果想在這些領域解決更難的問題,強大的基礎模型當然很重要。但正如Terry所說的,沒有高品質資料,再複雜的模型也會舉步維艰。
有一句老話叫「garbage in, garbage out」,在這裡體現得非常明顯。這也是為什麼AI x Science這樣的項目如此重要。
在2月10日的活動中,我們把來自不同學科、不同機構的一些頂尖學者聚到了一起。參與者包括來自UCLA、Berkeley、Caltech,以及美國和北美各地高校的研究者。
我們的主旨演講嘉賓中,還有一位最近獲得圖靈獎、同時也是強化學習領域的奠基者之一,理查德·薩頓。
我們也在促進跨地區研究者交流。推動AI x Science,離不開全球範圍內的共同參與。
量子位:SAIR具體如何支持科學家之間的跨學科、跨國家合作?
Chuck:IPAM(純粹與應用數學研究所)和UCLA其實在此方面已經做了很多年,而且做得非常好。IPAM長期以來都有組織跨學科主題專案和工作坊的傳統,時間跨度通常很長,參與領域也很廣。
我前不久去新加坡和馬來其實就是參加了由OpenMind組織的冬季學術營。OpenMind的創辦者正是圖靈獎得主理查德·薩頓,該組織主要面向來自世界各地的年輕研究者。
那次活動的參與者許多都來自亞洲,包括新加坡、馬來西亞、中國、菲律賓、韓國等地。大家聚在一起,交換想法,討論更高效的模型,一起思考AI接下來應該往哪裡走。
這種跨地區、跨學科的合作框架,與SAIR希望支持的方向高度一致。
陶哲軒:SAIR今年才剛剛起步,但IPAM已經運作了二十多年。
IPAM最具代表性的活動之一,是為期大約三個月的長期主題專案。在這些專案中,我們會邀請來自不同領域的學生、教師,有時也包括產業界的研究者,圍繞一個主題深入交流,比如心臟相關科學,或自動駕駛。
事實上,我在深度學習真正大規模興起之前,就已經舉辦過相關的研討會。
雖然IPAM並不是一個專門做AI的機構,但它舉辦了許多在AI相關方向上具有影響力的活動。核心理念就是把那些平時很少有機會交流的群體聚到一起,比如純數學家、應用數學家、物理學家、工程師,以及其他科學家。
過去,這種合作更多集中在學術內部。透過SAIR,我們希望把這種模式再往前推進一步,加強與產業界的連接,同時更關注一些中短期內能夠產生實際影響的應用。
我自己的背景仍然主要在數學,但現在我們也在更廣義地理解數學,把它放進一個連接理論、計算和現實影響的生態中。
我們希望嘗試新的形式,探索更多把不同社群聚在一起的可能性。
Chuck:IPAM和UCLA花了幾十年時間,打下了堅實的協作基礎,而透過SAIR,我們可以把這套模式在地區上、在學術與產業之間進一步擴展。
SAIR的核心目標是,基於已經行之有效的基礎,把它擴展成一個真正全球化、跨學科,並且緊密連接真實科學問題的合作網絡。
量子位:AI for Science的發展,會不會反过來影響今天產業界開發和使用AI的方式?它有沒有可能成為一條通向AGI的更優路徑?
陶哲軒:我覺得這是一個非常有前景的方向。
在數學和科學中,尤其是在數學裡,許多輸出是可以被形式化驗證的,這給了我們一種約束AI的方式。把AI放進一個可以驗證的環境中,這有助於減少幻覺。
如果我們能在數學或科學中,建立起可靠、可驗證的AI框架,這些原則是有可能推廣到其他領域的。
現在在醫學、金融等領域,完全信任AI仍然風險很高。你可以把它當作輔助工具,但在涉及生命安全或巨額資金時,很難放心地把控制權交給AI。
如果我們能先在科學領域解決可靠性和驗證的問題,之後這些成果就有機會遷移到更廣泛的應用中。
Chuck:以金融為例,大多數人並不願意把敏感的金融決策完全交給AI;醫學也是一樣,錯誤可能直接關係到生死。
因此,AI for Science,以及反过來的Science for AI,才顯得尤為重要。
如果我們能在科學環境中打造出真正值得信任的AI系統,我們希望這些進展可以在不久的將來,遷移到那些關鍵性應用場景中。
陶哲軒:沒錯。數學和科學為AI提供了一個非常安全的實驗場。
如果AI在醫療或金融情境中出錯,後果可能非常嚴重;但如果它算錯了一道數學題,最多就是再試一次,幾乎沒有損失。
這讓數學成為一個理想的環境,用來打磨可靠AI的系統。
Chuck:還有一個優勢在於,數學研究通常不需要像其他應用那樣消耗巨大的算力。這讓我們可以更高效地反覆實驗,用相對較低的成本探索新思路。
陶哲軒:這也是為什麼從這裡起步。藥物研發當然非常重要,但臨床試驗的成本極高、週期又很長,為了驗證一種AI方法就投入數十億美元是很難實現的。
相比之下,在數學中開發和測試AI,可以更快、更安全地驗證想法,再逐步走向那些高風險、高投入的領域。
量子位:有一種擔憂是,更高層次的研究能力,例如「品味」,本應建立在扎實的基礎訓練之上,但AI可能正在拆掉這些年輕研究者的成長階梯。你們怎麼看?
陶哲軒:現在,AI已經能完成過去屬於研究生或初級研究者訓練內容的工作,例如解一些標準問題、做實驗中的部分環節,或整理文獻。
這些事情越來越容易被自動化,於是會產生一種誘惑:既然AI更快,那乾脆全部讓AI來做。
但問題在於,這些看似重複、甚至有點枯燥的訓練,對人的成長非常重要。我自己,包括許多資深研究者的能力,很大一部份就來自這些初級工作。
所以必須有一個平衡。即便AI能做,我也必須有意識地為年輕研究者保留有價值的訓練過程。等一個人累積了足夠的經驗,例如親手做過一定數量的實驗之後,再逐步引入自動化。
Chuck:現在已經能看到一些過度依賴的趨勢。大家都知道AI並不能百分之百可信,但很多人仍會第一時間把問題丟給AI,直接要答案或建議,這其實會削弱獨立思考的能力。
這也是為什麼我們特別強調讓頂尖科學家參與進來。像Terry這樣的研究者,或其他諾貝爾獎級別的科學家,都是在沒有AI工具的時代接受過嚴格訓練的人。
透過建立一種類似「師徒制」的結構,讓經驗豐富的研究者與有潛力的年輕人緊密合作,能逐步形成更好的實踐方式、更好的模型,也包括更好的平台,在支持創新的同時,不犧牲學習本身。
陶哲軒:這裡其實也有一個很有意思的歷史類比。
計算器剛出現的時候,很多人擔心學生會由此不再學基本的算術了。
這種擔憂在某种程度上確實有道理,所以直到今天,我們仍然會先教孩子手算加減乘除,再讓他們用計算器。
但另一方面,計算器也極大地拓展了人們探索的空間。它讓人更容易去試驗數字、發現規律、探索原本很難觸及的想法。
工具本身並不會自動讓人變弱,它同樣可以激發探索與創造力。關鍵在於如何使用。
面對AI,我們也需要做出類似的判斷:什麼時候該用,什麼時候該克制,以及如何把它引入訓練體系,同時不削弱那些真正重要的核心能力。
量子位:隨著AI逐步取代很多現有的科研流程和技能,未來研究者最重要的能力和特質會是什麼?
陶哲軒:未來的科研將越來越多地以更大規模、更多元化的團隊形式展開。團隊裡可能既有學術研究者、產業研究人員、數學家和科學家,也會有AI系統和不同背景的人一起協作。
在此情境下,如何在大型團隊中高效合作,將成為一項非常重要的能力。
過去,人們常把科學描繪成「孤獨天才」的事業,但現實裡它早就是團隊合作,而且這種趨勢只會繼續加強。
溝通能力,以及我們常說的那些軟技能,將變得越來越重要。
在此背景下,「品味」非常關鍵。能夠形成整體判斷,識別哪些方向值得投入,再借助AI工具或其他合作者把想法展開,這種能力非常重要。
我們很可能會看到比過去更細膩的分工。
傳統上,尤其是在數學領域,工作方式幾百年幾乎沒什麼變,有時甚至帶點「中世紀風格」。一個人要同時負責檢查細節、做計算、發展想法、寫論文、申請經費,然後去做報告。
但在未來,大型專案會由很多人共同完成。有人負責長期願景,有人擅長與AI工具深度協作,有人負責團隊協調,有人負責把它講給更多人聽。
能為數學和科學做出貢獻的能力類型,將變得豐富得多。
Chuck:我經常半開玩笑地說自己是個「立志當科學家的人」,很大程度上是因為我有機會和像Terry這樣的傑出科學家、數學家長期合作。
我的背景並不在科研,而更多在商業領域。但我聽過一些非常成功、打造過數十億美元公司的人說過,他們見過最優秀的一些prompt工程師,背景並不是工程或計算機,而是會計、法律。
這恰恰說明,未來的科研將變得更加開放。借助AI和新的工具,來自完全不同背景的人,都有機會以有意義的方式參與科研。這也是我們所謂的「科學和AI普惠化」的重要內涵之一。
陶哲軒:我目前參與的許多項目,以及SAIR希望支持的方向,本身就已經是高度協作的。它們通常匯集了職業數學家、學生、其他學科的研究者,有時甚至還包括公眾參與者。
隨著AI和相關工具的發展,從事嚴肅科學和數學研究的門檻正在降低。這正是此次技術變革中,最令人興奮的一點。
量子位:那是不是意味著,未來連我還在讀國中的弟弟,都有可能在《Nature》上發表論文?
陶哲軒:這是有可能的(笑)。
未來可能會有論文擁有成千上萬名作者,每個人都貢獻其中的一小塊,但都是真實、有價值的貢獻。從這個意義上說,非常年輕的人參與其中,並不是不可能。
事實上,在數學領域已經出現過這樣的例子:有青少年在AI的幫助下,為某個已知問題找到了新的解法。它未必是最重大的突破,但確實是新的結果。
這種情況未來會變得更普遍,但目前還很難說,唯一的辦法就是繼續嘗試、不斷探索不同的研究方式。
Chuck:我其實非常希望能看到那樣的場景。在過去,如果你沒有很強的STEM或工程背景,幾乎不可能直接參與前沿科研。
如果來自非傳統背景的人,也能以有意義的方式參與科研,並真正對世界產生正面影響,那就是一件非常了不起的事情。
量子位:結合我們前面的討論,你們能不能舉一些更具體的例子,說說SAIR未來將如何支持年輕研究者的成長?
Chuck:這是個特別好的問題,說實話,這也是我個人非常投入的一件事。我多年來一直在做與導師制相關的工作,從大學階段就開始了。
從我的觀察來看,培養年輕研究者,最重要的一點是樹立榜樣。
人在不同階段,都會尋找榜樣。小時候,在家裡看父母;進了學校,看老師;再往後,就會把目光投向更廣闊的社會。
這也是為什麼我們如此重視把不同領域的傑出科學家聚在一起。每一位創始成員,成功的路徑都不一樣。
Barry Barish的科研經歷非常具有代表性。愛因斯坦在早期論文中就預測了引力波的存在,但從提出這個理論,到實驗上真的觀測到引力波,中間走了將近一百年。
但直到2016年前後,人類才首次探測到引力波,Barry Barish也因此在2017年獲得諾貝爾獎,目前Barry Barish也是SAIR諮詢委員會的創始成員。這個例子很好地闡釋了什麼叫幾十年如一日。
這些傑出科學家的價值,不只在於他們的成果,也在於他們能夠分享自己在不確定性、挫折與失敗中是如何堅持下來的。這是導師制中非常重要的一部分。
年輕科學家並不缺天賦,只是剛剛起步。所以我才會如此重視和Terry,以及整個創始團隊一起做這件事,因為現在最需要支持的,恰恰就是這些年輕人。
Terry是獨一無二的,但如果借助AI和更好的培養渠道,未來能不能不只有一個陶哲軒,而是一萬個陶哲軒?!這難道不是件非常令人興奮的事嗎?!
陶哲軒:是的。SAIR只是眾多嘗試中的一種,它不可能包辦所有事情。支持下一代研究者的需求非常廣泛,沒有任何單一組織能獨立完成培養整個科研隊伍的任務。SAIR能做的,是專注於少數有針對性的項目。
以IPAM為例,我們可以支持暑期學校、研習班,以及面向公眾的科普和交流活動。一些協作式、眾包式的研究項目,本身就會自然地吸引年輕研究者參與,有些情況下,他們甚至可以擔任領導角色。
我們希望,SAIR能對其他組織產生啟發,讓更多機構也願意站出來,在支持下一代科研人才這件事上承擔起重要責任。
陶哲軒如何使用AI?
量子位:接下來我想把話題轉到數學上。Terry,您最近在做什麼?有沒有哪些方向是您現在特別感興趣的?
陶哲軒:我現在大概有一半時間,仍然花在比較傳統的純數學研究上,也就是我過去23年來一直在做的那類工作。比如研究數字中的模式,理解高度結構化、週期性的函數和非常隨機的函數之間有什麼本質差異,以及研究一些偏微分方程,比如來自流體力學的方程。
不過在這些方向上,我現在越來越多地把一些最前沿、最技術性的進展交給更年輕的合作者來完成。相應地,我自己研究中的一個越來越重要的部分,開始與新技術產生關係,尤其是「如何做數學」「如何協作做數學」的新方式。
我目前非常感興趣的一個方向是形式化,也就是不再只依賴紙筆證明,而是把數學寫成電腦可以理解和自動驗證的形式化語言。這將深刻改變協作方式。它不僅讓我們可以和AI系統一起工作,也讓我們能夠和許多不認識的研究者協作。
在過去,如果一個陌生人給你發來一份證明,你很可能會對它是否正確保持懷疑;但如果這份數學內容是用可形式化驗證的語言寫成的,這種擔憂基本就不存在了。
借助這些方法,我們已經能在一些項目中實現數十人的協作,有時甚至五十人以上,而且其中很多人彼此從未見過面。大家可以一起解決那種單靠個人幾乎不可能完成的大問題。
我們也在嘗試把AI當作證明助手來使用,同時借鑒現代軟體工程裡的許多理念,例如使用GitHub做版本控制、進行單元測試、做品質檢查等等。
從某種意義上說,我正在學習軟體工程的工具,並把它們引入到一種可以稱為「數學工程」的實踐中。
對我來說,這一切更像是一系列實驗。並不是每一次嘗試都會成功,但即便弄清楚什麼行不通,本身也很有價值。
量子位:感覺您一直都很願意把新技術引入自己的研究流程。距離您上一次接受Lex Fridman採訪已經過去半年了,這段時間裡,您對AI的看法有變化嗎?
陶哲軒:總體來看,變化不大。但有一點出乎我意料,AI在數學方向上的進展,比我原先預期的要快一些,當然,距離真正成熟還有很長的路要走。
變化更明顯的,其實是整個學術社區的態度。我開始看到越來越多的同事接受這樣的一個事實:AI不會消失,它會長期存在下去。大家對嘗試不同使用方式的開放度,也明顯提高了。
不過,現在仍然缺少一個被廣泛理解和認可的中間態。很多時候,感覺只有兩個極端選擇:要么幾乎什麼都用AI,要么就完全不用。
真正理想的情況,應該是混合式工作流——大部分研究仍然用傳統方式完成,但把某些環節有意識、有控制地交給AI。目前我們還沒有真的找到那個最合適的平衡點。
我經常拿網際網路來類比。網際網路非常有用,但我們不會用它來做所有事情。我們仍然會選擇線下見朋友,而不是永遠開視訊會議;但在某些情況下,比如現在這樣的對話,網際網路又恰到好處。
經過多年,我們逐漸學會了什麼時候、怎麼用好網際網路。我想,對AI來說,我們仍在摸索這種平衡的過程中。
量子位:Terry,您是世界頂尖的數學家之一,也和許多一流數學家長期合作。你們在日常研究中,具體是怎麼使用AI的?
陶哲軒:其實挺日常的。我主要把AI用在一些偏輔助性的事情上。比如做文獻檢索,如果我一時想不起某個數學結論的具體形式,或者它和另一個結果之間的關係,我就直接問AI。再比如需要快速畫個圖、做個簡單的可視化,也會讓AI來幫忙。
在和文字相關的工作上,我用得更多。寫作時我幾乎一直開著自動補全。有時我會先把一篇論文的結構分成五步,自己寫完前兩步,後面幾步就讓AI幫我起草一下。
以至於現在,如果我在飛機上、沒法用AI寫東西,偶爾還會下意識地想:「怎麼還不幫我把這句話補完」,然後才反應過來AI不在。
如果有人給我發來一段很長的論證,或者一篇論文,我也常常先讓AI幫我總結一次。在這些方面,它確實是一個非常好用的工具。
但在真正做深度思考的時候,比如我在努力解決一個很難的研究問題時,我基本不會用AI。這種時候我仍然更依賴紙和筆。
我也嘗試過直接和AI一起推研究層級的問題,但目前的體驗並不理想。它給出的建議往往比較套路,有時還會打斷我的思路。不過,在圍繞科研的那些輔助環節上,AI已經變得非常有價值了。
量子位:過去一年里,有沒有出現什麼新的Aha-Moment?
陶哲軒:有的,通常是在一個問題上想了好幾個月,有一天突然意識到:「哦,原來這麼簡單,我怎麼之前沒想到?」
在這之前,你往往已經試過很多條路,有時八種、九種方法,全都走不通。但正是這些失敗的嘗試,一步步把不可能的方向排除掉,最後只剩下一條真正可行的路。等你終於看到那條路時,回頭看就會覺得它顯而易見。
這種時刻常常伴隨著一種錯覺,好像之前那些嘗試都是在浪費時間。但事實上,正是不斷試錯、不斷排除,才讓你真正理解什麼方向行得通。我自己的數學「頓悟」,到目前為止基本還是這樣產生的。
AI目前還無法重現這個過程。它確實能提出很多想法,但這些想法往往顯得比較隨機,也看不出它能像人一樣,從失敗中逐步學習、調整方向。到目前為止,我還沒有真正用AI來直接解決研究層級的難題。
不過,只要我已經有了清晰的思路或解法,AI就會變得非常有用。它可以幫我把結果寫出來、與已有文獻建立關係、生成程式碼,或在某些數學環節上提供計算支援。
從這個意義上說,它非常有價值,但更多是一種互補工具。它在支援我的工作,而不是取代我最在意的那一部分。
我覺得總體來說,人們更傾向於把AI用在自己不太享受的那些任務上,而把真正喜歡做的部分留給自己。對我來說,數學問題本身就是我最享受的事情,這也是我做數學的核心動力,所以這部分我仍會親自來。
但有些事情,我就非常樂意交給AI。比如在文獻中查找,有沒有人以前用過類似的方法,或者在成百上千篇論文裡篩選出相關工作,這對我來說就是一個非常理想的AI使用場景。再比如一些又長又繁瑣的計算,也非常適合交給AI。
當然,這件事因人而異。不同研究者享受的環節不一樣,而AI本身又是一個非常寬闊的工具。對一個人來說特別有用的功能,對另一個人來說可能就沒那麼重要。所以也談不上什麼「最好的模型」或「標準工作流」。
關鍵還是看你希望AI幫你做什麼,以及你更願意把哪些事情留給自己來完成。
量子位:數學曾經從其他學科中汲取養分。這次,數學已經從AI身上學到了什麼,或是未來可能會學到什麼?
陶哲軒:有一件事我自己正在大量學習,那就是軟體開發。
未來的數學,可能會越來越像今天的軟體開發。
如果回到五六十年前,軟體往往是由一個人獨立完成的:一個人寫程式碼、測試、除錯,所有事情都自己來。
但今天,軟體開發已經變成了一個成熟的產業。有人專門寫程式碼,有人負責UI,有人負責品質控制,還有一整套成熟的工作流、工具和最佳實踐,还有大量踩坑經驗。
數學正在開始向這種模式學習,包括它成功的地方,也包括它失敗過的地方。
傳統上,數學和物理的聯繫非常緊密。但現在,我們越來越多地和生命科學、社會科學等領域發生互動。這些領域的問題往往更複雜、更雜亂,方程沒有物理裡那麼乾淨,而且對資料的依賴也強得多。
從這個角度看,AI可能非常適合處理這類複雜、嘈雜、不那麼容易被形式化的問題。
我覺得,我們正在進入一個更加跨學科的時代。數學不再只是和物理對話,而是幾乎所有學科都在彼此交流,而AI正是推動這種跨學科互動的重要力量之一。
量子位:所以你現在也算是在「做軟體」了,對吧?
陶哲軒:從某種意義上來說是這樣。我現在參與的項目不少,但越來越多時,我更像是在做項目管理。真正去證明定理的,往往是其他合作者,而我更多是在協調整體工作,把不同部分拼接起來。
這是一個挺有趣的角色。在一些項目裡,我並不是主要的「解題者」,而是負責組織、推動,讓每個人都能把自己的能力發揮到最好。證明這樣的方式在科研中也可以運作得相當不錯。
量子位:AI不僅降低了做數學的門檻,看起來也在降低你剛才提到的許多其他領域的門檻,比如編程、物理和醫學。AI有沒有促使你對其他學科產生興趣?
陶哲軒:非常明顯。有一件事讓我自己都覺得意外的是,我現在合作的人,背景比以前多樣得多。
十年前,我幾乎只和數學家合作,偶爾會和統計學家或電子工程師一起做點事情,也就到此為止了。
但現在,我在和來自各個領域的人合作,尤其是產業界的人,比如Chuck這樣的夥伴。真的有一種感覺,大家都開始彼此對話了,而且在此過程中互相學習。
其他學科的研究者,往往能從更偏數學的思考方式中受益;而數學家也能從更貼近現實世界的視角中學到很多東西。
之所以能做到這一點,很大程度上是因為我們現在有了很多工具,其中不少是由AI驅動的,它們幫助我們理解彼此的語言和工作方式,讓合作變得更順暢、更高效。
我覺得這是當下這個階段真正令人興奮的地方之一:學科之間的壁壘正在降低,我們開始學會用過去很難實現的方式一起工作。
量子位:和背景差異很大的人一起工作,感覺怎麼樣?
陶哲軒:我其實非常享受這種狀態。當然,我也想先說清楚一點:深度領域專家永遠都有不可替代的位置。那種在非常狹窄的子領域裡做到世界頂尖的人,我們依然非常需要,這一點並沒有改變。
變化在於,這些專家現在可以和另一類人更緊密地合作,他們或許不專精於某一個具體領域,但擅長把不同學科的想法串聯起來,看到整體圖景。
這幾年裡,我自己學到了很多原本完全不在我訓練範圍內的東西,比如生物學、經濟學、政策、科研資助機制等等。有些內容確實出乎意料,有時也稍有挑戰性。
但我也發現,數學裡的一些核心觀念,能以很自然的方式遷移到其他領域,特別是關於驗證、嚴謹性和清晰思考的一套方法。
對我來說,這是一段持續學習的過程,而且我真的很享受。我相信,在新的科研環境裡,那些願意保持開放心態、樂於跨學科溝通、也不怕學習新「語言」的人,更容易如魚得水。
Chuck:Terry剛才說的,其實正好呼應了我們之前聊到的「技術普惠化」,尤其是AI。借助現在的技術,也包括SAIR在做的事情,我們正在把來自非常不同領域的一流人才聚到一起。
當你擁有這樣的一個網絡時,事情會變得容易許多。不僅更容易發現真正具有挑戰性的問題,也更容易迅速判斷,誰是最適合來解決這些問題的人。有時,這些人手裡已經有一部分答案;有時,他們能立刻把你引薦給更合適的合作者。
在我看来,這種高效連接問題與人才的能力,就是「AI普惠化」在現實中的一個非常具體的體現。
陶哲軒:從傳統上看,科研往往是围绕学科来组织的,比如數學系、物理系、經濟系等等。這種結構自然會讓數學家主要和數學家交流,物理學家主要和物理學家交流,真正的跨學科合作並不常見。
我對SAIR抱有期待的一點在於,它在一開始就刻意聚集了一群背景和興趣都非常多元的人。這種設計本身,就更容易促成一些在傳統體系裡不太容易出現的連接。
透過降低制度層面和學科層面的壁壘,我們有機會推動那些原本很難發生的合作。
AI時代,高校需要新的培養方式
量子位:Terry,你剛才提到傳統高等教育,正好也是我接下來想聊的话题。Chuck,在AI時代,你覺得哪些能力對大學生更重要?
Chuck:這些年我做過不少學生的導師。我的感受是,即便是博士生,真正長期、密切合作的導師數量也很有限,通常三到五位,多一点可能也就十位左右。這其實會限制他們接觸到的視角範圍。
但現在情況正在發生變化,特別是在AI x Science這樣的方向上。我們可以更容易地把不同類型的專業能力匯聚到一起。這類問題天然是跨學科的,而AI讓來自不同背景的大規模協作變得可行。
在此環境下,有一項能力會變得格外重要,那就是批判性思維。很多人喜歡談「提示詞工程」,但在我看来,提示詞工程本質上就是另一種形式的批判性思維。
你必須清楚自己要解決什麼問題,如何把問題表述清楚,以及你真正想要什麼樣的答案。如果這些想不明白,其實AI也幫不了你太多。
所以,清晰思考、提出好問題、抓住問題核心,這些能力仍然非常關鍵。
與此同時,AI也在降低非傳統STEM背景人群的參與門檻。我自己就是一個例子,我沒有接受過系統的科研訓練,背景更多在商業領域。
但借助AI,我依然可以有意義地參與科學討論,理解一些核心思想,並做出貢獻。這種體驗非常有力量。
未來並不只是STEM和非STEM的區分,而是讓不同技能結構的人,用不同方式參與進來。這正是AI x Science和SAIR如此重要的原因。
陶哲軒:事實上,對科學感興趣、希望參與其中的人,遠遠多於接受過正式科研訓練的人。而AI正好擴大了能夠參與科研的人群範圍。
未來的科學發展,並不只取決於技術能力,儘管技術仍然重要。組織能力、溝通能力、與他人協作的能力,正在變得越來越有價值。
但同時,是否具備整體視野,知道哪些問題值得投入精力,以及什麼時候該用技術、什麼時候該克制,這也非常重要。
量子位:現有的大學體系已經存在了很長時間。如今有了AI,很多人都覺得一場大的變革正在到來。你們覺得高等教育應該如何去適應?
陶哲軒:這是個非常棘手的問題。坦白說,我希望我們能有更多時間,來慢慢想清楚這些事。但現實是,我們只能「邊走邊想」。
已經能看到一些令人擔憂的現象。有些學生過度依賴AI,成績看起來很好,但實際上學到的東西並不多。
也有一些學生堅持完全用傳統方式學習,幾乎不用AI。他們往往理解得更扎實,但在效率和結果上,可能又會落後於那些大量使用工具的同學。
所以,明顯需要重新找一個平衡點。學校必須教會學生如何負責任地使用AI,也要讓他們知道在什麼時候不該用。
我認為,未來會更多地轉向小組項目和協作式學習,這本身也更貼近科研和產業的真實形態。
另外,課程之間可能需要更緊密地整合。現在的教育體系,往往把知識拆分成一個個相對孤立的專業模組。將來,也許需要一種更整體的結構,更強調通用的問題解決能力。
過去,學生是在作業、考試、以及和難題死磕的過程中,慢慢學會如何學習、如何面對失敗、如何承受壓力的。到目前為止,我們還沒有為這些能力找到一個結構清晰、系統性的替代方案。
大學眼下不得不被許多現實的問題牽著走,比如維持日常運轉、保障研究生經費、平衡預算等等,很難真正停下來,從零開始重新設計教育體系。
從歷史上看,我們也並不是第一次面對這種衝擊。電腦普及的時候,教育變過一次;網際網路出現後,又變過一次;維基百科剛出現時,也有一段時間,學生直接複製貼上內容交作業。
後來大家發現,解決辦法並不是完全禁止新技術,而是教學生如何正確使用它,把它當作起點,而不是終點。
我認為AI也是類似的情況。它可以成為探索和研究的一個起點,但不能取代思考本身。學生不能只是向AI要一個答案,貼上作業裡。
高等教育真正的挑戰,就在於如何找到那個平衡點:一方面充分發揮AI的優勢,另一方面又不犧牲深度學習和真正的智力成長。
Chuck:產業界的變化往往比學術界要快。在AI時代,這個差距變得越來越清晰。而這正是SAIR Foundation看到的機會所在——把學術界和產業界拉到一起,讓雙方相互學習。
從我和創業者打交道的經驗來看,他們有一個非常共同的特質:強烈的問題導向。不管問題有多難,他們都會盯著「怎麼解決」,並願意因此付出一切努力。
這種心態,是我希望高等教育能夠更多吸收的,尤其是在AI已經成為核心工具的背景下。大學的培養模式應該隨之調整,讓學生學會如何用AI去解決真實世界的問題,而不只是掌握一塊塊割裂的知識。
還有一個繞不開的大問題是成本。在許多發達國家,尤其是美國,高等教育極其昂貴。一些頂尖大學,一年的學費加相關費用接近10萬美元,四年下來就是40萬美元。
如果這種趨勢繼續下去,特別是在AI已經提供了獲取知識和技能的新路徑之後,人們自然會開始質疑:大學學位到底還值不值得?
這也是為什麼,讓教育與產業更緊密地對齊變得如此重要。我們需要更清楚地知道,社會真正需要什麼能力,以及大學該如何調整自身的培養方式來回應這些需求。
在接下來的一系列項目中,我們會把產業界和高等教育的負責人同時請到一起。我們正在組織一些圓桌討論,邀請來自賓夕法尼亞大學、南加州大學、UCLA等高校的代表,坦誠地討論課程體系和培養模式應該如何演進,以應對這些挑戰。
另外,我對像OpenMind這樣的組織印象很深。我們也在思考,是否可以做類似的實驗。透過SAIR,聯合IPAM和UCLA,我們正在探索舉辦更密集的項目,比如暑期學校。
這種形式的好處在於,它能讓我們更快地迭代課程內容,不必受制於傳統學期制度,同時也更貼合AI發展本身的節奏。
量子位:最後一個問題。Terry,如果未來真的實現了AGI,它的數學能力全面超過人類,我們還有必要學數學嗎?
陶哲軒:AGI本身其實是一個非常模糊的概念,不同的人對它的理解差異很大。
我舉個例子,交通工具。過去,人們靠走路、騎馬出行;之後有了汽車和飛機,效率遠遠高於步行。但我們並沒有因此就不走路了,不是因為必須這麼做,而是因為喜歡,或者因為這對身體有益。
科學和數學將來也可能是類似的情況。即便有一天,借助AGI,科學發現的速度遠遠快於人類單獨完成的速度,人們依然會想親自去做科學、做數學。
它可能會更多地變成一種手藝、一種愛好,或者一種出於興趣、好奇心和自我滿足的智力活動。
同時我也相信,無論AI變得多么強大,人類都會以不同於機器的方式繼續創造價值。
人類學習和推理的方式,與AI非常不同。AI可以通過海量資料和計算得出結論;而人類有時卻能在極少的資料、極低的計算量下,做出相當不錯的判斷。這種能力,很可能在未來依然重要。
科學的規模和方式,可能會發生巨大的變化。今天,一個研究者通常一次只解決一個問題;未來,或許可以同時推進成千上萬、甚至上百萬個問題。由人類把握少數關鍵方向,AI來填補其餘部分。
我們目前還沒到那一步,但這是一個合理的演進方向。即便在那樣的未來,學習數學依然有意義,只是它的角色和目的,可能會和今天非常不同。