电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

DeepSeek新模型有多猛 開源AI的重大突破(2)

關(guān)鍵詞:
2025-11-28 15:24:50  華爾街見聞

DeepSeekMath-V2的卓越表現(xiàn),標(biāo)志著其在復(fù)雜的數(shù)學(xué)推理領(lǐng)域,與全球領(lǐng)先的AI實驗室站在了同一起跑線上。國際數(shù)學(xué)奧林匹克競賽(IMO)通常被認(rèn)為是全球難度最高的高中生數(shù)學(xué)競賽,在2025年的競賽中,630名人類參賽者中僅有72人獲得金牌。

除了在IMO 2025取得的成就,該模型還在其他高難度數(shù)學(xué)競賽中展現(xiàn)了頂級水平。據(jù)DeepSeek稱,它在中國最頂尖的全國性競賽——中國數(shù)學(xué)奧林匹克(CMO)中也達到了金牌水平。在面向大學(xué)本科生的普特南數(shù)學(xué)競賽(Putnam 2024)中,該模型在12道題中完全解決了11道,另一道題也僅有微小錯誤,最終得分118/120,超過了人類參賽者90分的最高分記錄。

與谷歌和OpenAI尚未公開的實驗?zāi)P拖啾?,DeepSeekMath-V2的核心吸引力在于其徹底的開放性。該模型的權(quán)重已在開源社區(qū)Hugging Face上發(fā)布,允許研究人員和開發(fā)者自由下載。Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clement Delangue在社交平臺X上盛贊道:“想象一下,你可以免費擁有世界上最優(yōu)秀數(shù)學(xué)家之一的大腦。”他補充說,此前沒有任何聊天機器人或API能讓你接觸到一個IMO 2025金牌水平的模型。用戶可以不受限制地探索、微調(diào)、優(yōu)化模型,并運行在自己的硬件上。

近期的人工智能模型雖然擅長在數(shù)學(xué)基準(zhǔn)測試中獲得正確答案,但往往缺乏嚴(yán)謹(jǐn)?shù)耐评磉^程。為了解決這一問題,DeepSeekMath-V2采用了一種創(chuàng)新的自我驗證訓(xùn)練框架。該方法的核心是訓(xùn)練一個專門的“驗證器”,任務(wù)是評估證明過程的質(zhì)量,而不是最終答案的對錯。隨后,這個驗證器被用作獎勵模型,引導(dǎo)一個獨立的“證明生成器”。只有當(dāng)生成器成功識別并修復(fù)自身證明中的錯誤時,它才會獲得獎勵。

這種機制激勵模型在最終確定答案之前,盡可能多地發(fā)現(xiàn)和解決自身推理鏈條中的問題。DeepSeek強調(diào),對于沒有已知解決方案的開放性問題,自我驗證在擴展測試時計算方面尤為重要。測試時計算指的是在推理階段分配大量計算資源,讓模型有更長時間進行推理、探索多種解決方案并完善答案。

為了防止模型過度擬合其自身的檢查機制,DeepSeek采用了一種動態(tài)進化的策略。該團隊通過增加計算量和自動標(biāo)記難以驗證的證明,來不斷提升驗證過程的難度,確保驗證器與生成器同步進化。這種方法允許他們擴展驗證計算,以自動標(biāo)記新的、難以驗證的證明,從而創(chuàng)造新的訓(xùn)練數(shù)據(jù)來進一步改進驗證器。通過這種驗證-生成閉環(huán)和元驗證機制,模型能夠?qū)崿F(xiàn)全自動化的數(shù)據(jù)標(biāo)注和持續(xù)的性能優(yōu)化,驗證了自驅(qū)動學(xué)習(xí)系統(tǒng)在解決復(fù)雜數(shù)學(xué)推理任務(wù)上的可行性。

(責(zé)任編輯:0882)
關(guān)閉

荷蘭安世呼吁安世中國參與對話、加速供應(yīng)鏈恢復(fù)

荷蘭安世呼吁安世中國參與對話2025-11-28 15:24:23

瘋狂動物城2系列花束 點燃觀影與購物熱潮

瘋狂動物城2系列花束2025-11-28 15:23:19

香港消防員火場中救出貓狗 生命無小事

香港消防員火場中救出貓狗2025-11-28 15:20:22

企業(yè)被舉報規(guī)定員工如廁超時罰款 廁所監(jiān)控引發(fā)爭議

企業(yè)被舉報規(guī)定員工如廁超時罰款2025-11-28 15:06:14

為什么中國要堅定地參與維和!

為什么中國要堅定地參與維和2025-11-28 14:58:37

如何看待蔡斌回歸上海女排 再續(xù)輝煌篇章

如何看待蔡斌回歸上海女排2025-11-28 15:18:17

雷軍回應(yīng)小米汽車輪轂設(shè)計:是安全設(shè)計而非不堅固

雷軍回應(yīng)小米汽車輪轂設(shè)計2025-11-28 15:07:26

從受災(zāi)到入住新房只花了三個月 村民喜迎新居

從受災(zāi)到入住新房只花了三個月2025-11-28 15:02:05

南部空軍保密教育片搞笑但有用!

南部空軍保密教育片搞笑但有用2025-11-28 14:17:01

芝商所“宕機”,期貨交易停擺,網(wǎng)友戲言“白銀新高有人壓力太大?” 罕見故障凍結(jié)全球交易

芝商所宕機,期貨交易停擺,網(wǎng)友戲言白銀新高有人壓力太大2025-11-28 15:05:46

美對委動武箭在弦上了嗎 石油資源成關(guān)鍵

美對委動武箭在弦上了嗎2025-11-28 13:11:20

日本膽敢染指臺灣就是侵略中國本土 東海風(fēng)浪警示紅線

日本膽敢染指臺灣就是侵略中國本土2025-11-28 13:15:01

香港消防員火場中救出貓狗 生命無小事

香港消防員火場中救出貓狗2025-11-28 15:20:22

荷蘭安世呼吁安世中國參與對話、加速供應(yīng)鏈恢復(fù)

荷蘭安世呼吁安世中國參與對話2025-11-28 15:24:23

尹錫悅被控助前防長逃往國外!

尹錫悅被控助前防長逃往國外2025-11-28 13:22:33

日本縱容右翼就是與危險為伍 年輕人絕望推動極端

日本縱容右翼就是與危險為伍2025-11-28 13:29:21

一女子發(fā)布虛假視頻被拘留 女子被行政拘留五日!

一女子發(fā)布虛假視頻被拘留2025-11-28 15:14:04

郭正亮怒批賴清德炒作大陸2027年攻臺 民進黨操作選舉戲碼

郭正亮怒批賴清德炒作大陸2027年攻臺2025-11-28 15:01:54

使館提醒中國公民暫勿前往阿富汗 邊境安全事件頻發(fā)

使館提醒中國公民暫勿前往阿富汗2025-11-28 13:50:06

宏福苑工程顧問公司2名董事被拘捕 安全承諾成空談

宏福苑工程顧問公司2名董事被拘捕2025-11-28 15:04:18

美國黑手伸向比雷埃夫斯港

美國黑手伸向比雷埃夫斯港!2025-11-28 13:33:41

美知名學(xué)者稱高市早苗邁出錯誤一步 加劇中日緊張關(guān)系

美知名學(xué)者稱高市早苗邁出錯誤一步2025-11-28 14:19:35

俄軍無人機焚毀烏軍防無人機路網(wǎng)!鋁熱劑空中突襲

俄軍無人機焚毀烏軍防無人機路網(wǎng)2025-11-28 14:39:22

重慶公交貼滿廣告助力寶貝回家 網(wǎng)友怒贊!

重慶公交貼滿廣告助力寶貝回家2025-11-28 15:18:47

高市在黨首會上被問到翻白眼 引爆國際輿論

高市在黨首會上被問到翻白眼2025-11-28 13:15:19

女子賭場結(jié)識男子借其10萬港元輸光 誣告反被捕

女子賭場結(jié)識男子借其10萬港元輸光2025-11-28 15:03:51

瘋狂動物城2系列花束 點燃觀影與購物熱潮

瘋狂動物城2系列花束2025-11-28 15:23:19

特朗普稱將對委展開地面行動 打擊毒品販運者

特朗普稱將對委展開地面行動2025-11-28 13:35:15

法國:堅定不移奉行一個中國政策 彰顯獨立外交傳統(tǒng)

法國,堅定不移奉行一個中國政策2025-11-28 14:21:15

高市在黨首會上問到翻白眼 尷尬一幕引熱議

高市在黨首會上問到翻白眼2025-11-28 13:13:20

白宮槍擊案后特朗普痛批拜登 要求嚴(yán)審阿富汗移民

白宮槍擊案后特朗普痛批拜登2025-11-28 13:35:41

100個“野人",救了一座山!

100個“野人",救了一座山2025-11-28 15:09:29

北京明確非機動車嚴(yán)禁逆行闖紅燈 新規(guī)加強安全管理

北京明確非機動車嚴(yán)禁逆行闖紅燈2025-11-28 15:16:26

相關(guān)新聞