电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

DeepSeek推出新模型 數(shù)學推理達IMO金牌水平

關(guān)鍵詞:
2025-11-28 10:26:50  第一財經(jīng)

11月27日晚,DeepSeek在Hugging Face上開源了一個新模型:DeepSeek-Math-V2。這是一個數(shù)學模型,也是目前首個達到IMO金牌水平且開源的模型。

DeepSeek推出新模型

在同步發(fā)布的技術(shù)論文中,DeepSeek表示Math-V2的部分性能優(yōu)于谷歌旗下的Gemini DeepThink,并展示了模型在IMO-ProofBench基準以及近期數(shù)學競賽上的表現(xiàn)。具體來看,在Basic基準上,DeepSeek-Math-V2達到了近99%的高分,遠勝其他模型,而排在第二的Gemini Deep Think (IMO Gold)分數(shù)為89%。但在更難的Advanced子集上,Math-V2分數(shù)為61.9%,略遜于Gemini Deep Think (IMO Gold)的65.7%。

DeepSeek推出新模型 數(shù)學推理達IMO金牌水平

在這篇名為《DeepSeek Math-V2:邁向可自驗證的數(shù)學推理》的論文中,DeepSeek指出大語言模型已經(jīng)在數(shù)學推理方面取得了重大進展,這是人工智能的重要試驗臺,如果進一步推進,可能會對科學研究產(chǎn)生影響。但當前AI在數(shù)學推理方面存在局限:以正確的最終答案作為獎勵,正確的答案卻不能保證正確的推理。許多數(shù)學任務(wù)如定理證明需要嚴格的分步推導(dǎo),而不是數(shù)字答案,這使得最終答案獎勵不適用。

為了突破深度推理的極限,DeepSeek認為有必要驗證數(shù)學推理的全面性和嚴謹性。團隊提出自我驗證對于擴展測試時間計算尤為重要,特別是對于那些沒有已知解決方案的開放問題。此次推出的Math-V2從結(jié)果導(dǎo)向轉(zhuǎn)向了過程導(dǎo)向,展示了強大的定理證明能力。這一模型不依賴大量的數(shù)學題答案數(shù)據(jù),而是通過教會AI如何像數(shù)學家一樣嚴謹?shù)貙彶樽C明過程,從而在沒有人類干預(yù)的情況下不斷提升解決高難度數(shù)學證明題的能力。

關(guān)閉

遺體照片和遺物辨認程序開放 火災(zāi)后續(xù)處理啟動!

遺體照片和遺物辨認程序開放2025-11-28 10:24:54

河內(nèi)公安2比1北京國安 國安遭逆轉(zhuǎn)無緣出線

河內(nèi)公安2比1北京國安2025-11-28 10:24:42

美國男子殺妻女兒追兇15年 懸案終現(xiàn)突破

美國男子殺妻女兒追兇15年2025-11-28 10:24:30

預(yù)計將有多股冷空氣接連登場 氣溫變化節(jié)奏快

預(yù)計將有多股冷空氣接連登場2025-11-28 10:18:11

俄烏終局將近了嗎 烏克蘭的雙重絞殺

俄烏終局將近了嗎2025-11-28 10:11:44

俄媒展示戰(zhàn)場上精心偽裝的爆炸物 紙幣錢包食品玩具都能觸發(fā)爆炸!

俄媒展示戰(zhàn)場上精心偽裝的爆炸物 紙幣錢包食品玩具都能觸發(fā)爆炸2025-11-28 10:09:56

日本右翼網(wǎng)暴石破茂 事件持續(xù)發(fā)酵!

日本右翼網(wǎng)暴石破茂2025-11-28 10:19:17

賀文萍:烏克蘭敗局已定 和平計劃背后的博弈

賀文萍,烏克蘭敗局已定2025-11-28 09:47:57

一覺醒來!萬億泡沫破裂了 谷歌TPU沖擊英偉達

一覺醒來,萬億泡沫破裂了2025-11-28 10:16:52

泰國洪災(zāi)女子躲冰箱 4天后獲救 伴母遺體度過艱難時刻

泰國洪災(zāi)女子躲冰箱4天后獲救2025-11-28 10:01:53

高市早苗嚴重越線挑釁一意孤行 終將自食其果

高市早苗嚴重越線挑釁一意孤行2025-11-28 09:45:09

普京稱烏撤離烏控區(qū)后 俄會停止行動 俄軍推進加速

普京稱烏撤離烏控區(qū)后俄會停止行動2025-11-28 10:04:07

歐洲對美28點計劃提出重大修改!

歐洲對美28點計劃提出重大修改2025-11-28 09:31:28

辟謠珠峰安裝電梯 AI生成虛假信息

辟謠珠峰安裝電梯2025-11-28 10:21:42

暗盤“蹦極”!這家公司上市前夜,最高漲超90%,收盤僅漲2.66% 比亞迪為最大外部股東

暗盤蹦極,這家公司上市前夜,最高漲超90%,收盤僅漲2,66%2025-11-28 10:22:56

深圳14歲男生刺死同班女生被判無期

深圳14歲男生刺死同班女生被判無期2025-11-28 10:17:42

蘇翊鳴回應(yīng)晉級決賽:壓力還是蠻大的!

蘇翊鳴回應(yīng)晉級決賽2025-11-28 10:11:55

13歲男孩感染甲流1天變白肺 甲流高峰期一定要做好防護

13歲男孩感染甲流1天變白肺2025-11-28 10:16:07

儲戶起訴銀行索回資金遭駁回,二審開庭!

儲戶起訴銀行索回資金遭駁回,二審開庭2025-11-28 10:14:19

美國政治改革,留下一地雞毛 改革理想破滅

美國政治改革,留下一地雞毛2025-11-28 10:02:06

5招快速識別流感和普通感冒 了解癥狀差異

5招快速識別流感和普通感冒2025-11-28 10:12:28

普京亮明停戰(zhàn)底線傳遞什么信號?

普京亮明停戰(zhàn)底線傳遞什么信號2025-11-28 10:18:20

遺體照片和遺物辨認程序開放 火災(zāi)后續(xù)處理啟動!

遺體照片和遺物辨認程序開放2025-11-28 10:24:54

支行長挪用超2億 儲戶起訴銀行敗訴 資金中介騙局揭秘

支行長挪用超2億儲戶起訴銀行敗訴2025-11-28 10:19:46

行長挪用2億獲刑 儲戶訴銀行敗訴 儲戶維權(quán)路漫漫

行長挪用2億獲刑儲戶訴銀行敗訴2025-11-28 10:14:35

美國男子殺妻女兒追兇15年 懸案終現(xiàn)突破

美國男子殺妻女兒追兇15年2025-11-28 10:24:30

埃及會購買上百架殲-10CE嗎?

埃及會購買上百架殲-10CE嗎2025-11-28 09:31:46

外交部回應(yīng)高市早苗的“不再提及”表態(tài):并非“撤回錯誤言論” 中方絕不接受 性質(zhì)完全不同

外交部回應(yīng)高市早苗的不再提及表態(tài),并非撤回錯誤言論中方絕不接受2025-11-28 09:49:25

歐盟指責美國勒索歐盟放寬數(shù)字監(jiān)管 貿(mào)易談判不應(yīng)捆綁

歐盟指責美國勒索歐盟放寬數(shù)字監(jiān)管2025-11-28 10:00:03

河內(nèi)公安2比1北京國安 國安遭逆轉(zhuǎn)無緣出線

河內(nèi)公安2比1北京國安2025-11-28 10:24:42

國防部表示絕不允許日本軍國主義幽靈再為禍人間 正告日方停止修憲擴軍

國防部表示絕不允許日本軍國主義幽靈再為禍人間2025-11-28 10:04:24

精度高、彈種全、覆蓋廣 遠程箱式火箭炮指哪打哪!

精度高、彈種全、覆蓋廣 遠程箱式火箭炮指哪打哪2025-11-28 09:27:30

美國國民警衛(wèi)隊成員遭槍擊 嫌疑人已被拘留

美國國民警衛(wèi)隊成員遭槍擊2025-11-28 09:18:13

楊瀚森NBA杯賽最后一分鐘登場1中0 開拓者無緣淘汰賽獎金

楊瀚森NBA杯賽最后一分鐘登場1中02025-11-28 10:22:38

相關(guān)新聞