DeepSeek新模型有多猛 開源AI的重大突破!DeepSeek最新發(fā)布的開源數(shù)學模型DeepSeekMath-V2,在全球最難的高中數(shù)學競賽中達到了金牌水平,成為首個實現(xiàn)這一成就的開源模型,標志著開源人工智能在復雜推理能力上的一次重大突破。

昨日,DeepSeek宣布推出其最新的數(shù)學推理模型DeepSeekMath-V2。該模型在模擬的2025年國際數(shù)學奧林匹克競賽(IMO)中解決了6個問題中的5個,達到了金牌水平。這一成就使其成為第一個在IMO級別競賽中獲得金牌的開源模型,引發(fā)了AI研究和開發(fā)者社區(qū)的高度關注。

今年7月,谷歌DeepMind的Gemini高級版本和一個來自OpenAI的實驗性推理模型也達到了IMO 2025的金牌標準,同樣解決了5個問題。然而,與這些閉源實驗模型不同,DeepSeekMath-V2的模型權重根據(jù)Apache 2.0許可證公開發(fā)布,可供公眾下載。

DeepSeekMath-V2采用了一種創(chuàng)新的自我驗證訓練框架。該方法的核心是訓練一個專門的“驗證器”,任務是評估證明過程的質量,而不是最終答案的對錯。為了防止模型過度擬合其自身的檢查機制,DeepSeek通過增加計算量和自動標記難以驗證的證明,來不斷提升驗證過程的難度,確保驗證器與生成器同步進化。
此舉被視為人工智能民主化的重要一步。該模型的發(fā)布不僅證明了開源社區(qū)有能力在尖端AI研究領域追趕甚至比肩頂級閉源實驗室,也可能再次引發(fā)市場對于開源模型是否會侵蝕閉源產品商業(yè)護城河的討論。
DeepSeekMath-V2的卓越表現(xiàn),標志著其在復雜的數(shù)學推理領域,與全球領先的AI實驗室站在了同一起跑線上。國際數(shù)學奧林匹克競賽(IMO)通常被認為是全球難度最高的高中生數(shù)學競賽,在2025年的競賽中,630名人類參賽者中僅有72人獲得金牌。
除了在IMO 2025取得的成就,該模型還在其他高難度數(shù)學競賽中展現(xiàn)了頂級水平。據(jù)DeepSeek稱,它在中國最頂尖的全國性競賽——中國數(shù)學奧林匹克(CMO)中也達到了金牌水平。在面向大學本科生的普特南數(shù)學競賽(Putnam 2024)中,該模型在12道題中完全解決了11道,另一道題也僅有微小錯誤,最終得分118/120,超過了人類參賽者90分的最高分記錄。
與谷歌和OpenAI尚未公開的實驗模型相比,DeepSeekMath-V2的核心吸引力在于其徹底的開放性。該模型的權重已在開源社區(qū)Hugging Face上發(fā)布,允許研究人員和開發(fā)者自由下載。Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clement Delangue在社交平臺X上盛贊道:“想象一下,你可以免費擁有世界上最優(yōu)秀數(shù)學家之一的大腦?!彼a充說,此前沒有任何聊天機器人或API能讓你接觸到一個IMO 2025金牌水平的模型。用戶可以不受限制地探索、微調、優(yōu)化模型,并運行在自己的硬件上。
近期的人工智能模型雖然擅長在數(shù)學基準測試中獲得正確答案,但往往缺乏嚴謹?shù)耐评磉^程。為了解決這一問題,DeepSeekMath-V2采用了一種創(chuàng)新的自我驗證訓練框架。該方法的核心是訓練一個專門的“驗證器”,任務是評估證明過程的質量,而不是最終答案的對錯。隨后,這個驗證器被用作獎勵模型,引導一個獨立的“證明生成器”。只有當生成器成功識別并修復自身證明中的錯誤時,它才會獲得獎勵。
這種機制激勵模型在最終確定答案之前,盡可能多地發(fā)現(xiàn)和解決自身推理鏈條中的問題。DeepSeek強調,對于沒有已知解決方案的開放性問題,自我驗證在擴展測試時計算方面尤為重要。測試時計算指的是在推理階段分配大量計算資源,讓模型有更長時間進行推理、探索多種解決方案并完善答案。
為了防止模型過度擬合其自身的檢查機制,DeepSeek采用了一種動態(tài)進化的策略。該團隊通過增加計算量和自動標記難以驗證的證明,來不斷提升驗證過程的難度,確保驗證器與生成器同步進化。這種方法允許他們擴展驗證計算,以自動標記新的、難以驗證的證明,從而創(chuàng)造新的訓練數(shù)據(jù)來進一步改進驗證器。通過這種驗證-生成閉環(huán)和元驗證機制,模型能夠實現(xiàn)全自動化的數(shù)據(jù)標注和持續(xù)的性能優(yōu)化,驗證了自驅動學習系統(tǒng)在解決復雜數(shù)學推理任務上的可行性。
10月20日,人工智能團隊DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR11月27日晚,DeepSeek在Hugging Face上開源了一個新模型:DeepSeek-Math-V2。這是一個數(shù)學模型,也是目前首個達到IMO金牌水平且開源的模型
2025-11-28 10:26:50DeepSeek推出新模型證券時報的文章內容僅供參考,不構成實質性投資建議,據(jù)此操作風險自擔。下載“證券時報”官方APP或關注官方微信公眾號,可以隨時了解股市動態(tài),洞察政策信息,把握財富機會
2025-09-20 12:51:47DeepSeek為何發(fā)表研究成果