UCLA、MIT數學家推翻39年經典數學猜想!AI證明卡在99.99%,人類最終證偽

新智元報導  

編輯:Aeneas 好睏

【新智元導讀】39年來一個看似理所當然的數學理論,剛剛被數學家證偽!UCLA和MIT的研究者證實:概率論中眾所周知的假設「上下鋪猜想」是錯的。有趣的是,他們用AI已經證明到了99.99%的程度,但最終,靠的還是理論論證。

又一個看似堅固無比的數學理論,被證偽了!

最近,UCLA和MIT的研究者證偽了概率論中眾所周知的假設——「上下鋪猜想」。

上下鋪猜想(Bunkbed Conjecture)也稱為雙層床猜想,是滲透理論中的一個陳述,該領域處理的是在圖的邊隨機刪除後存在的路徑和簇。

猜想指出,在生成的隨機子圖中,上(下)鋪的頂點連接到上(下)鋪的某個頂點的概率,大於或等於它連接到下(上)鋪頂點——即對應同構頂點的概率。

用白話說就是,在同一層的兩個頂點之間的連接概率不可能小於連接不同層頂點之間的概率。這看起來確實再明顯不過了!

1985年,數學家Pieter Kasteleyn首次提出了上下鋪猜想。

然而,這個問題的猜想卻讓幾代概率論學家都束手無策,一直作為一個多年未解的難題存在至今。原因在於……它是錯的!

39年後,來自UCLA和MIT的三位研究者,在使用AI工具卻多次折戟後,採用了全新的方法,發現了它的反例。

論文地址:https://arxiv.org/abs/2410.02545論文地址:https://arxiv.org/abs/2410.02545

由此,在學界似乎堅固無比的「上下鋪猜想」自然就被推翻了。

此前,大量的工作都被用在證明這個猜想的正確性上,然而這幾位研究者卻反其道而行之,經歷多次失敗後,終於找到了反例。

猜想十分符合直覺,但是錯的

許多數學家做研究的過程,是由直覺驅動的,比如可以感知數學真理的印度數學天才拉馬努金。

這種直覺,來自對某些事情應該為真的深刻認知。但有時,直覺也會誤導數學家,因為早期證據無法代表全貌,一個看似顯而易見的陳述,也會有某些隱藏的細微之處。

20世紀80年代中期,一位名叫Pieter Kasteleyn的荷蘭物理學家,想要在數學上證明一個關於液體如何在多孔固體中流動的推斷。

由此,他提出了上下鋪猜想。

要理解這個猜想,要先從一個圖開始:這個圖是由線或邊連接的點或頂點的集合。

現在,讓我們做一個這個圖的精確副本,然後將它直接放置在原始圖的上方。

在它們之間畫一些垂直的柱子——這些是連接底部圖上一些頂點與頂部圖上對應頂點的額外邊。

最終,我們會得到一個類似於上下鋪的結構。

接下來,考慮底部圖中的一條邊。

拋一次硬幣,如果是正面,就擦掉這條邊;如果是反面,就保留這條邊。對兩個圖中的每條邊重覆這一過程。

最終,頂部和底部的圖會看起來不同,但它們仍然會通過垂直的「柱子」相連。

最後,在底部圖中選擇兩個頂點。

你能沿著圖的邊從一個頂點走到另一個頂點嗎,還是這兩個頂點現在已經不連通了?

對於任何一個圖,你都可以計算出存在路徑的概率。

現在,再來看這兩個相同的頂點,不過把其中一個替換為它在頂部圖中正上方的頂點。有沒有一條路徑,可以讓你從底部圖中的起點頂點到頂部圖中的終點頂點?

此處再複習一下:上下鋪猜想認為,在下鋪找到路徑,其概率總是大於或等於跳到上鋪找到路徑的概率。

無論從哪個圖開始,在上下鋪之間畫多少垂直柱,選擇哪些起始和終點頂點,都不影響這一事實。

從直覺上看,這是個理所當然的事。

「我們的大腦告訴我們的任何信息,都表明這個猜想應該是正確的」,普林斯頓大學的圖論學家Maria Chudnovsky這樣說

也因此,幾十年來,數學家們一直認為這是真的。

他們的直覺告訴他們,在一個舖位上移動應該比在兩個舖位之間移動更容易——從下鋪到上鋪所需的額外垂直跳躍,應該會顯著減少可用路徑的數量。

而且,數學家們也希望它是真的。因為這些圖可以被視為流體如何在多孔材料中移動或滲透的簡化模型,就像水在海綿中移動一樣。

如果上下鋪猜想成立,物理學中被廣泛相信的流體通過固體的可能性也就成立,滲流物理學的相關問題也能被解決。

然而數學家們在39年間嘗試了無數次,卻無人能夠證明。

原因就在於——上下鋪猜想是錯的!

嘗試用神經網絡證偽

並不是所有數學家都相信上下鋪猜想的真實性,加州大學洛杉磯分校的數學家Igor Pak就是其中一個。

他的研究生Nikita Gladkov表示,對於學界一直集中精力試圖證明這個猜想,自己的導師毫不掩飾自己的批評。「如果它是錯的呢?」

Nikita GladkovNikita Gladkov

Igor Pak的懷疑還有一個理由:這個說法過於寬泛了。它真的適用於每個可想像的圖嗎?

「有些猜想是由實際動機驅動的,而其他猜想則是數學家的一廂情願。」上下鋪猜想看起來更像是後者。

Igor Pak的博客Igor Pak的博客

早在2022年,他就開始著手推翻它。

花了一年時間後,他以失敗告終。

Igor Pak意識到,是時候上一些暴力了!他讓學生Gladkov使用計算機,對能找到的每一個圖進行「暴力搜索」。

這就涉及到一些複雜的編程,因此Gladkov找來了大學室友、現MIT研究生Aleksandr Zimin,也是自己睡在下鋪的兄弟。

Aleksandr ZiminAleksandr Zimin

三人開始手動檢查少於九個頂點的每一個可能的圖。在這些圖中,上下鋪猜想是成立的。

但對於更大的圖,可能的情況數量就一下子激增,他們無法再通過窮舉法,窮盡所有可能的邊緣刪除方式或路徑形成方式了。

隨後,陷入困頓的三人轉向了AI。

使用機器學習方法,他們訓練了一個神經網絡,用於生成可能更偏好向上跳躍的迂迴路徑圖。

在眾多示例中他們發現,下鋪路徑會比上鋪替代路徑概率稍高一點。但模型始終沒有發現任何反例——也就是不同層路徑概率更高的情況。

還有一個問題,就是神經網絡生成的每個圖過於龐大,以至於數學家們根本不可能調查拋硬幣步驟的每一個結果。

相反,團隊必須計算這些結果子集上上下路徑的概率。

他們意識到,自己可以對神經網絡給出的任何反例有超過99.99%的信心,卻始終無法達到100%。

三人陷入懷疑:這種方法是否還值得?畢竟,只能達到99%而非百分百的證明,根本不足以說服數學圈,也不會被哪個著名期刊認為是足夠嚴謹的證明。

「博士生需要的是現實中的工作,而不是理論上的工作,」Pak在博客上寫道。Gladkov和Zimin很快就要找工作了,最終,三人停止了這項工作。

雖然他們放棄了計算方法,卻並未停止思考這個問題。接下來的幾個月,他們拚命想做出一個不需要計算機的理論論證,卻缺少所需的所有要素。

就在這時,一項來自英國的研究,讓事情有了轉機。

最後,不用計算機了

6月,劍橋大學的Lawrence Hollom在另一種語境下,證偽了上下鋪問題的一個版本。

這個猜想的表述並非針對圖,而是研究稱為超圖(hypergraph)的數學對象。在超圖中,邊的定義不再局限於連接一對頂點,而是可以連接任意數量的頂點。

Hollom找到了這個版本猜想的一個反例。他創建了一個小型超圖,每條邊都連接三個頂點:

Gladkov發現這篇論文後意識到,這正是他們三人所需要的!

他從晚上一直讀到淩晨3點,並在睡覺前給Zimin發了短信。第二天,兩個人便通了電話。就能否將Hollom的反例轉化為一個能否推翻原始上下鋪猜想的普通圖,展開了討論。

其實,這對老朋友之前就考慮過如何將超圖轉化為圖。

去年年初,他們在一起參加音樂會之前討論過這個問題。「紅辣椒樂隊在唱歌,而我在思考這個問題,」Gladkov說道。

後來,他們開發出了可以在特定情況下將超圖轉化為圖的技術。

如今,這些技術剛好可以用來改造Hollom的超圖。

Gladkov、Pak和Zimin用龐大的點集和普通邊組成的集群,替換了超圖中的每個三頂點邊。

最終,他們得到了一個巨大的圖,由7,222個頂點和14,422條邊連接而成。

他們放棄了AI的方法後,利用構建的理論來重新證明。

最終,他們在圖中發現,對於位於下路徑的點,找到上路徑的概率比找到下路徑高出1/10^6,500個百分點——雖然這個數值極小,但並不為0。

由此可以證明:上下鋪猜想是錯誤的!

果然,數學家們在任何時刻都不能想當然地接受任何事。普林斯頓數學家Noga Alon表示:「我們必須保持懷疑,即便是那些直覺上看起來極有可能為真的事情。」

不過,Gladkov、Pak和Zimin只是找到了許多符合該猜想的小圖,但這些例子並且最終反映出——當頂點和邊的數量足夠多時,數學家可以構造出更為複雜且反直覺的圖。

正如Hollom所言,「我們真的像我們自認為的那樣,理解所有東西嗎?」

目前,數學家們仍然相信激發上下鋪猜想的關於固體中連接位置的物理命題。但他們需要找到其他方法來證明它。

與此同時,Pak表示,數學家們顯然需要更積極地討論數學證明的本質。他們最終並未依賴有爭議的計算方法,而是以完全確定的方式推翻了猜想。

但隨著計算機和AI的研究方法在數學研究中變得越來越普遍,一些數學家也在討論:該領域的規範是否需要改變?

「這是一個哲學問題,」Alon說道,「我們該如何看待那些僅在高概率下成立的證明呢?」

羅格斯大學的數學家Doron Zeilberger認為,未來的數學圈會接受這樣的概率性證明。在50年內或更短時間內,人們就會形成全新的態度。

在論文中,他經常把自己的計算機(Shalosh B. Ekhad)列為合著者。

「Shalosh」和「Ekhad」在希伯來語中分別意為「三」和「一」,也就是Zeilberger第一台計算機AT&T 3B1;代指他所用到的任意一台——從紐澤西辦公室里的戴亞電腦,到偶爾在奧地利調用的超級計算機

但也有一些人,則擔心這樣的未來可能會危及一些根本性的東西。「概率性證明可能會削弱我們對問題本質的理解和直覺,」Alon認為。

最後Pak建議,鑒於這類研究日益增多,應該為它們創建專門的學術期刊,以免其價值被數學界忽視。

「這個問題沒有標準答案。但我希望學術界能夠認真思考,當下一個類似的研究結果出現時,我們是否應該接受它。」

隨著AI等技術持續滲透和改變數學領域,這個問題只會愈發緊迫。

團隊介紹

Nikita Gladkov

Nikita Gladkov是加州大學洛杉磯分校數學系博士生,導師是Igor Pak。

此前,他在俄羅斯高等經濟學院獲得數學學士學位,導師是Alexander Kolesnikov,並曾在Yandex數據分析學校學習數據分析。

Igor Pak

Igor Pak是加州大學洛杉磯分校數學系教授,隸屬於組合數學研究組,這是美國最古老的組合數學研究組之一。

此前,他曾在明尼蘇達大學和麻省理工學院擔任過副教授,在耶魯大學擔任過J. W. Gibbs講師,並在MSRI擔任過博士後研究員。

他於1993年在莫斯科國立大學獲得數學學士學位,1997年在哈佛大學獲得數學博士學位

Aleksandr Zimin

Aleksandr Zimin是麻省理工學院數學系博士三年級學生,在Philippe Rigollet教授的指導下進行研究。主要研究領域是最優運輸理論。

他正在和Alexander Kolesnikov和Nikita Gladkov一起研究Monge-Kantorovich問題的廣義化,並與Aleh Tsyvinski(耶魯大學)和Job Boerma(威斯康辛大學麥基迪遜分校)合作研究在經濟學中的應用。

同時,他還對計算機科學有濃厚的興趣——曾在Yandex數據分析學校完成了為期兩年的課程,深入學習了機器學習的不同領域。

他具有豐富的高質量計算機代碼編寫經驗,從而能夠在研究中進行複雜的數值實驗。

他於2019年在莫斯科高等經濟大學以最高榮譽獲得數學學士學位,2021年在俄羅斯斯高爾科沃科學技術研究院獲得數學與理論物理碩士學位,同年在莫斯科高等經濟大學獲得數學碩士學位。

參考資料:

Math’s ‘Bunkbed Conjecture’ Has Been Debunked

The bunkbed conjecture is false