5月28日晚,DeepSeek在官方交流群中宣布R1模型已完成小版本試升級。今年3月,DeepSeek對V3模型進(jìn)行小版本升級時(shí)也采用了同樣的方式,先通過官方交流群宣布,隨后才公布具體更新內(nèi)容。
本次試升級,DeepSeek依舊保持低調(diào),沒有發(fā)布詳細(xì)的技術(shù)說明文檔或舉行發(fā)布活動(dòng)。然而,據(jù)用戶測試,更新后的模型在寫作任務(wù)、長上下文優(yōu)化、推理速度和代碼生成等方面都有顯著提升。Live CodeBench平臺顯示,其性能可以媲美OpenAI最新的o3模型高版本。有網(wǎng)友發(fā)現(xiàn)新版R1的風(fēng)格與OpenAI的o3有相似之處,有開發(fā)者稱這是“開源的巨大勝利”。一些用戶反饋,升級后的模型在思維鏈(CoT)行為上發(fā)生了明顯變化,表明該版本可能在推理中間步驟及復(fù)雜任務(wù)分步處理方面有了更多改進(jìn)。
今年以來,隨著R1的爆火,大家一直關(guān)注DeepSeek R2模型何時(shí)發(fā)布。盡管這次R1進(jìn)行了“小版本試升級”,但仍未有關(guān)于R2的消息。此前,DeepSeek針對V3模型和R1模型都做了一次迭代,但R2模型的具體發(fā)布時(shí)間仍不確定。除了上述模型能力,開發(fā)者還希望未來DeepSeek R2能大幅提升上下文長度并增加多模態(tài)功能。印度技術(shù)服務(wù)提供商Zensar首席運(yùn)營官曾表示,DeepSeek的R2模型發(fā)布可能會(huì)成為AI行業(yè)的一個(gè)關(guān)鍵時(shí)刻,促使全球公司加速研發(fā)進(jìn)程,打破目前由幾家主導(dǎo)企業(yè)壟斷的局面。關(guān)于R2的最新官方消息來自于今年3月,當(dāng)時(shí)市場流傳DeepSeek即將發(fā)布新一代R2模型的傳聞,但DeepSeek官方明確聲明這是一則假消息。
3月24日晚,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324。這次更新是DeepSeek V3模型的小版本升級,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新