谷歌AI攻克6道世界級(jí)數(shù)學(xué)難題 數(shù)學(xué)界最后防線崩塌。剛剛,人類(lèi)數(shù)學(xué)界面臨了一次前所未有的沖擊。AI不僅能夠解題,現(xiàn)在甚至能獨(dú)立完成PhD級(jí)別的純粹數(shù)學(xué)研究。谷歌DeepMind的最新AI研究智能體Aletheia,在一場(chǎng)名為「FirstProof」的挑戰(zhàn)賽中,解決了10道公認(rèn)的世界級(jí)未解數(shù)學(xué)難題中的6道。
DeepMind高管Thang Luong在X上激動(dòng)地表示,這一成就比去年歷史性拿下IMO金牌的意義還要重大。這些題目連全球最頂尖的數(shù)學(xué)家都感到棘手。結(jié)果,Aletheia不僅自主算出了答案,甚至連提出其中第7題猜想的數(shù)學(xué)家Jim Fowler也親自確認(rèn)了AI的解題過(guò)程是完全正確的。天才數(shù)學(xué)家陶哲軒也在最新的訪談中表示,AI已經(jīng)成為了他的“初級(jí)合著者”。
Aletheia之所以如此強(qiáng)大,是因?yàn)樗莆樟艘豁?xiàng)關(guān)鍵技能:自我過(guò)濾。傳統(tǒng)的AI大模型常有不懂裝懂的問(wèn)題,但在科研級(jí)別的高端局中,這樣的行為是不可接受的。DeepMind給Aletheia設(shè)計(jì)了兩個(gè)子系統(tǒng):“生成者”和“驗(yàn)證者”。前者負(fù)責(zé)大開(kāi)腦洞,瘋狂猜想解題路徑;后者則專(zhuān)門(mén)負(fù)責(zé)挑刺。當(dāng)遇到無(wú)法解決的問(wèn)題時(shí),Aletheia會(huì)直接告知“未找到解法”,而不是胡編亂造。
在這次挑戰(zhàn)中,Aletheia投入了大量算力,特別是第7題,其計(jì)算量是之前解開(kāi)Erd?s-1051問(wèn)題時(shí)的整整16倍。數(shù)學(xué)界權(quán)威Sang Hyun Kim高度評(píng)價(jià)了AI的解題步驟,認(rèn)為這是獨(dú)一無(wú)二的稀有案例。
這次挑戰(zhàn)賽的結(jié)果充滿戲劇性。2月6日題目放出后,專(zhuān)業(yè)學(xué)者、民間高手和各大AI實(shí)驗(yàn)室紛紛參與。到2月14日揭曉答案時(shí),沒(méi)有任何人或團(tuán)隊(duì)全部拿下。出題者自己用Gemini 3.0 Deep Think和ChatGPT 5.2 Pro跑了一輪,也只解出了2道。最終,OpenAI最強(qiáng)內(nèi)部系統(tǒng)在有限人類(lèi)監(jiān)督下解出5道。相比之下,Aletheia零人工干預(yù)做出6道題的含金量非常高。
數(shù)學(xué)圈對(duì)此反應(yīng)不一,一部分人直呼逆天,另一部分人則認(rèn)為還有4道題未解,離替代數(shù)學(xué)家還遠(yuǎn)。但一個(gè)不可逆轉(zhuǎn)的趨勢(shì)已經(jīng)顯現(xiàn):我們需要更難的題庫(kù)來(lái)測(cè)試AI,并且動(dòng)作必須快,因?yàn)楝F(xiàn)有的一切正在以肉眼可見(jiàn)的速度過(guò)期。
Epoch AI顯然意識(shí)到了這一點(diǎn),他們?cè)贔irstProof開(kāi)賽同期放出了FrontierMath: Open Problems,收錄了16道專(zhuān)業(yè)數(shù)學(xué)家死磕過(guò)但至今全軍覆沒(méi)的真正未解之謎。上線至今,沒(méi)有任何AI解出哪怕一道,這個(gè)“零分”現(xiàn)狀反而證明了題庫(kù)的價(jià)值所在。
FirstProof團(tuán)隊(duì)已宣布將在3月14日推出難度更變態(tài)的第二輪挑戰(zhàn)。陶哲軒在最新訪談中表示,AI現(xiàn)在是他的“初級(jí)合著者”,并描述了一種全新的數(shù)學(xué)研究范式。他認(rèn)為,傳統(tǒng)數(shù)學(xué)研究像是“個(gè)案研究”,而AI正在讓數(shù)學(xué)家第一次有能力做“大樣本普查”。AI不僅能處理繁瑣的計(jì)算,還能系統(tǒng)性地掃描人類(lèi)根本沒(méi)精力去碰的問(wèn)題長(zhǎng)尾。
所有信號(hào)都在指向同一個(gè)事實(shí):AI正在以一種不可逆的姿態(tài)嵌入人類(lèi)數(shù)學(xué)研究的核心流程。隨著3月14日FirstProof第二輪挑戰(zhàn)賽的開(kāi)啟,今天這篇文章里的所有數(shù)字可能就已經(jīng)過(guò)時(shí)了。
近日,黑龍江大學(xué)、清華大學(xué)和新加坡國(guó)立大學(xué)合作完成了一項(xiàng)突破性研究成果,并在《Nature》上發(fā)表
2025-11-27 14:56:03新突破