电竞下注-中国电竞赛事及体育赛事平台

<center id="syluc"></center>

<center id="syluc"></center>

中華網(wǎng) china.com

新聞

國內(nèi) 國際社會體育專題軍事財經(jīng) 滾動政務(wù) 冬奧

DeepSeek推出新模型數(shù)學推理達IMO金牌水平

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-11-28 10:26:50 第一財經(jīng)

11月27日晚，DeepSeek在Hugging Face上開源了一個新模型：DeepSeek-Math-V2。這是一個數(shù)學模型，也是目前首個達到IMO金牌水平且開源的模型。

DeepSeek推出新模型

在同步發(fā)布的技術(shù)論文中，DeepSeek表示Math-V2的部分性能優(yōu)于谷歌旗下的Gemini DeepThink，并展示了模型在IMO-ProofBench基準以及近期數(shù)學競賽上的表現(xiàn)。具體來看，在Basic基準上，DeepSeek-Math-V2達到了近99%的高分，遠勝其他模型，而排在第二的Gemini Deep Think (IMO Gold)分數(shù)為89%。但在更難的Advanced子集上，Math-V2分數(shù)為61.9%，略遜于Gemini Deep Think (IMO Gold)的65.7%。

DeepSeek推出新模型數(shù)學推理達IMO金牌水平

在這篇名為《DeepSeek Math-V2：邁向可自驗證的數(shù)學推理》的論文中，DeepSeek指出大語言模型已經(jīng)在數(shù)學推理方面取得了重大進展，這是人工智能的重要試驗臺，如果進一步推進，可能會對科學研究產(chǎn)生影響。但當前AI在數(shù)學推理方面存在局限：以正確的最終答案作為獎勵，正確的答案卻不能保證正確的推理。許多數(shù)學任務(wù)如定理證明需要嚴格的分步推導(dǎo)，而不是數(shù)字答案，這使得最終答案獎勵不適用。

為了突破深度推理的極限，DeepSeek認為有必要驗證數(shù)學推理的全面性和嚴謹性。團隊提出自我驗證對于擴展測試時間計算尤為重要，特別是對于那些沒有已知解決方案的開放問題。此次推出的Math-V2從結(jié)果導(dǎo)向轉(zhuǎn)向了過程導(dǎo)向，展示了強大的定理證明能力。這一模型不依賴大量的數(shù)學題答案數(shù)據(jù)，而是通過教會AI如何像數(shù)學家一樣嚴謹?shù)貙彶樽C明過程，從而在沒有人類干預(yù)的情況下不斷提升解決高難度數(shù)學證明題的能力。

12 全文共 2 頁下一頁

關(guān)閉

遺體照片和遺物辨認程序開放火災(zāi)后續(xù)處理啟動！

遺體照片和遺物辨認程序開放2025-11-28 10:24:54

河內(nèi)公安2比1北京國安國安遭逆轉(zhuǎn)無緣出線

河內(nèi)公安2比1北京國安2025-11-28 10:24:42

美國男子殺妻女兒追兇15年懸案終現(xiàn)突破

美國男子殺妻女兒追兇15年2025-11-28 10:24:30

預(yù)計將有多股冷空氣接連登場氣溫變化節(jié)奏快

預(yù)計將有多股冷空氣接連登場2025-11-28 10:18:11

俄烏終局將近了嗎烏克蘭的雙重絞殺

俄烏終局將近了嗎2025-11-28 10:11:44

解放軍演練“母港遇襲”有何信號錘煉實戰(zhàn)化應(yīng)急響應(yīng)能力

解放軍演練母港遇襲有何信號2025-11-28 09:25:21

俄媒展示戰(zhàn)場上精心偽裝的爆炸物紙幣錢包食品玩具都能觸發(fā)爆炸！

俄媒展示戰(zhàn)場上精心偽裝的爆炸物紙幣錢包食品玩具都能觸發(fā)爆炸2025-11-28 10:09:56

日本右翼網(wǎng)暴石破茂事件持續(xù)發(fā)酵！

日本右翼網(wǎng)暴石破茂2025-11-28 10:19:17

賀文萍：烏克蘭敗局已定和平計劃背后的博弈

賀文萍,烏克蘭敗局已定2025-11-28 09:47:57

一覺醒來！萬億泡沫破裂了谷歌TPU沖擊英偉達

一覺醒來,萬億泡沫破裂了2025-11-28 10:16:52

泰國洪災(zāi)女子躲冰箱 4天后獲救伴母遺體度過艱難時刻

泰國洪災(zāi)女子躲冰箱4天后獲救2025-11-28 10:01:53

高市早苗嚴重越線挑釁一意孤行終將自食其果

高市早苗嚴重越線挑釁一意孤行2025-11-28 09:45:09

普京稱烏撤離烏控區(qū)后俄會停止行動俄軍推進加速

普京稱烏撤離烏控區(qū)后俄會停止行動2025-11-28 10:04:07

歐洲對美28點計劃提出重大修改！

歐洲對美28點計劃提出重大修改2025-11-28 09:31:28

辟謠珠峰安裝電梯 AI生成虛假信息

辟謠珠峰安裝電梯2025-11-28 10:21:42

暗盤“蹦極”！這家公司上市前夜，最高漲超90%，收盤僅漲2.66% 比亞迪為最大外部股東

暗盤蹦極,這家公司上市前夜,最高漲超90%,收盤僅漲2,66%2025-11-28 10:22:56

深圳14歲男生刺死同班女生被判無期

深圳14歲男生刺死同班女生被判無期2025-11-28 10:17:42

蘇翊鳴回應(yīng)晉級決賽：壓力還是蠻大的！

蘇翊鳴回應(yīng)晉級決賽2025-11-28 10:11:55

13歲男孩感染甲流1天變白肺甲流高峰期一定要做好防護

13歲男孩感染甲流1天變白肺2025-11-28 10:16:07

儲戶起訴銀行索回資金遭駁回，二審開庭！

儲戶起訴銀行索回資金遭駁回，二審開庭2025-11-28 10:14:19

美國政治改革，留下一地雞毛改革理想破滅

美國政治改革,留下一地雞毛2025-11-28 10:02:06

5招快速識別流感和普通感冒了解癥狀差異

5招快速識別流感和普通感冒2025-11-28 10:12:28

普京亮明停戰(zhàn)底線傳遞什么信號？

普京亮明停戰(zhàn)底線傳遞什么信號2025-11-28 10:18:20

遺體照片和遺物辨認程序開放火災(zāi)后續(xù)處理啟動！

遺體照片和遺物辨認程序開放2025-11-28 10:24:54

支行長挪用超2億儲戶起訴銀行敗訴資金中介騙局揭秘

支行長挪用超2億儲戶起訴銀行敗訴2025-11-28 10:19:46

行長挪用2億獲刑儲戶訴銀行敗訴儲戶維權(quán)路漫漫

行長挪用2億獲刑儲戶訴銀行敗訴2025-11-28 10:14:35

美國男子殺妻女兒追兇15年懸案終現(xiàn)突破

美國男子殺妻女兒追兇15年2025-11-28 10:24:30

埃及會購買上百架殲-10CE嗎？

埃及會購買上百架殲-10CE嗎2025-11-28 09:31:46

外交部回應(yīng)高市早苗的“不再提及”表態(tài)：并非“撤回錯誤言論” 中方絕不接受性質(zhì)完全不同

外交部回應(yīng)高市早苗的不再提及表態(tài),并非撤回錯誤言論中方絕不接受2025-11-28 09:49:25

歐盟指責美國勒索歐盟放寬數(shù)字監(jiān)管貿(mào)易談判不應(yīng)捆綁

歐盟指責美國勒索歐盟放寬數(shù)字監(jiān)管2025-11-28 10:00:03

河內(nèi)公安2比1北京國安國安遭逆轉(zhuǎn)無緣出線

河內(nèi)公安2比1北京國安2025-11-28 10:24:42

國防部表示絕不允許日本軍國主義幽靈再為禍人間正告日方停止修憲擴軍

國防部表示絕不允許日本軍國主義幽靈再為禍人間2025-11-28 10:04:24

精度高、彈種全、覆蓋廣遠程箱式火箭炮指哪打哪！

精度高、彈種全、覆蓋廣遠程箱式火箭炮指哪打哪2025-11-28 09:27:30

美國國民警衛(wèi)隊成員遭槍擊嫌疑人已被拘留

美國國民警衛(wèi)隊成員遭槍擊2025-11-28 09:18:13

楊瀚森NBA杯賽最后一分鐘登場1中0 開拓者無緣淘汰賽獎金

楊瀚森NBA杯賽最后一分鐘登場1中02025-11-28 10:22:38

相關(guān)新聞

DeepSeek開源新模型DeepSeek-OCR 探索視覺-文本壓縮邊界
10月20日，人工智能團隊DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR
DeepSeek使用率暴跌原因何在？新模型R2缺席影響顯著
由于新模型R2遲遲未發(fā)布，DeepSeek近期備受關(guān)注。國際知名半導(dǎo)體研究機構(gòu)Semianalysis的報告顯示，DeepSeek的用戶使用率從年初的7.5%峰值顯著下降至3%，官網(wǎng)流量同期下滑近三成
2025-07-10 13:25:04DeepSeek使用率暴跌原因何在
DeepSeek為何發(fā)表研究成果揭示AI模型秘密
證券時報的文章內(nèi)容僅供參考，不構(gòu)成實質(zhì)性投資建議，據(jù)此操作風險自擔。下載“證券時報”官方APP或關(guān)注官方微信公眾號，可以隨時了解股市動態(tài)，洞察政策信息，把握財富機會
2025-09-20 12:51:47DeepSeek為何發(fā)表研究成果
DeepSeek的新模型很瘋狂：整個AI圈都在研究視覺路線，Karpathy不裝了
DeepSeek-OCR 論文的發(fā)布在一夜之間打破了大模型的傳統(tǒng)范式。昨天下午，全新模型 DeepSeek-OCR 開源，該模型能夠?qū)?000個字的文章壓縮成100個視覺token，壓縮比達到十倍且精度可達97%
2025-10-21 13:55:19DeepSeek的新模型很瘋狂
DeepSeek開源新版R1 媲美OpenAI 性能媲美o3模型
DeepSeek開源了R1最新0528版本，盡管官方未對此版本進行詳細說明，但已有網(wǎng)友在著名代碼測試平臺Live CodeBench中發(fā)現(xiàn)其性能可與OpenAI最新的o3模型高版本相媲美
2025-05-29 08:46:15DeepSeek開源新版R1媲美OpenAI
DeepSeek在《自然》雜志公布論文 R1模型成本創(chuàng)新低
AI初創(chuàng)公司DeepSeek的論文最近登上了《自然》雜志。該公司表示，其強大的AI模型R1的成功并不依賴于模仿其他大型語言模型生成的示例進行訓練。這一聲明隨著R1模型同行評審版本的發(fā)布而公布
2025-09-20 12:18:52DeepSeek在自然雜志公布論文

今日熱點

日本強震高市神色慌張小跑進入官邸緊急設(shè)立對策室

在日中國游客稱“連滾帶爬躲廁所” 地震瞬間的求生本能

藍戰(zhàn)非被綁架1天1夜沒睡覺南非驚魂經(jīng)歷

日本發(fā)生7.5級地震海嘯警報引發(fā)關(guān)注

頻道熱點

主編郵箱
網(wǎng)上不良信息舉報電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動態(tài)
版權(quán)所有中華網(wǎng)

<big id="afhss"><legend id="afhss"><button id="afhss"></button></legend></big>

<var id="afhss"><tr id="afhss"></tr></var>

<span id="afhss"><tr id="afhss"></tr></span>

<ol id="afhss"></ol>

<mark id="afhss"></mark>