論文提到Math-V2在IMO 2025和CMO 2024上取得了金牌級成績,在Putnam 2024上通過擴展測試計算實現(xiàn)了接近滿分的成績(118/120)。DeepSeek認為雖然仍有許多工作要做,但這些結(jié)果表明可自我驗證的數(shù)學(xué)推理是一個可行的研究方向,可能有助于開發(fā)更強大的數(shù)學(xué)AI系統(tǒng)。
對于DeepSeek此次的動作,海外的反應(yīng)是“鯨魚終于回來了”。有網(wǎng)友感慨DeepSeek以10個百分點的優(yōu)勢擊敗了谷歌的IMO Gold獲獎模型DeepThink,這不在預(yù)測范圍內(nèi)?!跋胂笠幌?,當(dāng)他們公布編程模型時會發(fā)生什么,我打賭他們絕對有編程模型。”
目前行業(yè)頭部廠商的模型已經(jīng)又迭代了一輪,11月先是OpenAI發(fā)布了GPT-5.1,幾天后xAI發(fā)布Grok 4.1,上周谷歌發(fā)布了Gemini 3系列引爆AI圈,“也該輪到DeepSeek出牌了”。外界更加關(guān)注的是DeepSeek的旗艦?zāi)P偷降资裁磿r候更新,行業(yè)期待“鯨魚”的下一個動作。
10月20日,人工智能團隊DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR