DeepSeek又更新了,期待梁文鋒“炸場” V3.1帶來新驚喜。DeepSeek最近更新了線上模型版本至V3.1,但并不是大家期待的R2模型。此次升級在上下文長度和交互友好度上有顯著改進,編程能力也受到推崇。有開發(fā)人員指出,DeepSeek可能將V3與R1模型進行了合并,這有助于降低模型部署成本。
DeepSeek方面回應稱,一切以官方公布為準。值得注意的是,這次更新恰逢R1發(fā)布后的第七個月。在這段時間里,OpenAI、Google、阿里巴巴、月之暗面、智譜等公司紛紛發(fā)布了新模型,都將R1作為參照物。而R2作為R1的后續(xù)產(chǎn)品,一直是行業(yè)關注的焦點,大廠需要新的參照物,公眾也在期待梁文鋒的新作。
實測顯示,DeepSeek網(wǎng)頁端及最新版本App支持的上下文長度已擴展至128K。開發(fā)者體驗后發(fā)現(xiàn),穩(wěn)定性更強,推理能力有所進步。相較于之前的V3(參數(shù)量671B),V3.1(參數(shù)量685B)在模型尺寸上變化不大,但在交互體驗上有了明顯提升。此外,DeepSeek在Aider Polyglot多語言編程測試中表現(xiàn)出色,擊敗了Claude 4 Opus,并且在設計宮崎駿風格的五子棋游戲界面上展示了強大的編程能力。
在最新的DeepSeek App和官網(wǎng)上,輸入框中的“深度思考(R1)”按鈕直接變成了“深度思考”。這意味著開啟深度思考模式后,DeepSeek調(diào)用的推理模型可能不再局限于R1,可能是其他新模型或V3/R1合并后的新模型。有開發(fā)者指出,此次更新將V3和R1進行了合并部署,使得部署成本大幅下降。
目前,在Huggingface上,最新更新的DeepSeek-V3.1-Base版本已經(jīng)開放源代碼,但官方并未給出具體信息,只簡單提及該模型尺寸為685B,支持BF16、F8_E4M3、F32數(shù)據(jù)類型。
盡管V3.1在用戶體驗和經(jīng)濟性上帶來了一些驚喜,但業(yè)界期待的新一代R2模型仍未出現(xiàn)。今年1月,伴隨DeepSeek R1發(fā)布并迅速引發(fā)各界關注,用戶增長迅速。隨后,各大廠商開始借鑒或集成DeepSeek,騰訊元寶、百度、360等新產(chǎn)品應運而生。國內(nèi)廠商如阿里巴巴、月之暗面、智譜等也相繼發(fā)布了新模型,并聲稱超越了DeepSeek R1。
接近DeepSeek的人士透露,R2在8月內(nèi)并無發(fā)布計劃。聯(lián)想創(chuàng)投集團高級合伙人宋春雨表示,梁文鋒對商業(yè)化不感興趣,專注于打磨基礎模型。市場對于DeepSeek的期待值愈發(fā)強烈,下一步如何在經(jīng)濟性和可用性上創(chuàng)新將成為關鍵。業(yè)內(nèi)人士認為,V3.1發(fā)布后,DeepSeek多模態(tài)模型的發(fā)布時間或許不遠了。
3月24日晚,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324。這次更新是DeepSeek V3模型的小版本升級,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新中國人工智能初創(chuàng)公司深度求索(DeepSeek)于3月24日深夜低調(diào)上線了新版本DeepSeek-V3-0324,參數(shù)量達到6850億
2025-03-26 19:28:23DeepSeek低調(diào)扔了版更新昨晚,DeepSeek 無預警發(fā)布了 DeepSeek-V3-0324 模型。雖然官方低調(diào)地稱其為“小版本迭代”,但實測表現(xiàn)遠超預期
2025-03-25 23:00:02DeepSeek小更新表現(xiàn)遠超預期DeepSeek服務突然全面宕機,API接口、網(wǎng)頁平臺及移動App均無法訪問或響應。這種情況通常發(fā)生在高峰訪問期間或遭遇安全攻擊時
2025-08-12 07:26:40DeepSeek崩了