DeepSeek又更新了,期待梁文鋒“炸場” V3.1帶來新驚喜。DeepSeek最近更新了線上模型版本至V3.1,但并不是大家期待的R2模型。此次升級在上下文長度和交互友好度上有顯著改進(jìn),編程能力也受到推崇。有開發(fā)人員指出,DeepSeek可能將V3與R1模型進(jìn)行了合并,這有助于降低模型部署成本。
DeepSeek方面回應(yīng)稱,一切以官方公布為準(zhǔn)。值得注意的是,這次更新恰逢R1發(fā)布后的第七個(gè)月。在這段時(shí)間里,OpenAI、Google、阿里巴巴、月之暗面、智譜等公司紛紛發(fā)布了新模型,都將R1作為參照物。而R2作為R1的后續(xù)產(chǎn)品,一直是行業(yè)關(guān)注的焦點(diǎn),大廠需要新的參照物,公眾也在期待梁文鋒的新作。
實(shí)測顯示,DeepSeek網(wǎng)頁端及最新版本App支持的上下文長度已擴(kuò)展至128K。開發(fā)者體驗(yàn)后發(fā)現(xiàn),穩(wěn)定性更強(qiáng),推理能力有所進(jìn)步。相較于之前的V3(參數(shù)量671B),V3.1(參數(shù)量685B)在模型尺寸上變化不大,但在交互體驗(yàn)上有了明顯提升。此外,DeepSeek在Aider Polyglot多語言編程測試中表現(xiàn)出色,擊敗了Claude 4 Opus,并且在設(shè)計(jì)宮崎駿風(fēng)格的五子棋游戲界面上展示了強(qiáng)大的編程能力。
在最新的DeepSeek App和官網(wǎng)上,輸入框中的“深度思考(R1)”按鈕直接變成了“深度思考”。這意味著開啟深度思考模式后,DeepSeek調(diào)用的推理模型可能不再局限于R1,可能是其他新模型或V3/R1合并后的新模型。有開發(fā)者指出,此次更新將V3和R1進(jìn)行了合并部署,使得部署成本大幅下降。
目前,在Huggingface上,最新更新的DeepSeek-V3.1-Base版本已經(jīng)開放源代碼,但官方并未給出具體信息,只簡單提及該模型尺寸為685B,支持BF16、F8_E4M3、F32數(shù)據(jù)類型。
3月24日晚,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324。這次更新是DeepSeek V3模型的小版本升級,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新中國人工智能初創(chuàng)公司深度求索(DeepSeek)于3月24日深夜低調(diào)上線了新版本DeepSeek-V3-0324,參數(shù)量達(dá)到6850億
2025-03-26 19:28:23DeepSeek低調(diào)扔了版更新