DeepSeek又更新了，期待梁文鋒“炸場” V3.1帶來新驚喜

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-08-21 09:54:59 新浪財經(jīng)

DeepSeek又更新了，期待梁文鋒“炸場” V3.1帶來新驚喜。DeepSeek最近更新了線上模型版本至V3.1，但并不是大家期待的R2模型。此次升級在上下文長度和交互友好度上有顯著改進，編程能力也受到推崇。有開發(fā)人員指出，DeepSeek可能將V3與R1模型進行了合并，這有助于降低模型部署成本。

DeepSeek方面回應稱，一切以官方公布為準。值得注意的是，這次更新恰逢R1發(fā)布后的第七個月。在這段時間里，OpenAI、Google、阿里巴巴、月之暗面、智譜等公司紛紛發(fā)布了新模型，都將R1作為參照物。而R2作為R1的后續(xù)產(chǎn)品，一直是行業(yè)關注的焦點，大廠需要新的參照物，公眾也在期待梁文鋒的新作。

實測顯示，DeepSeek網(wǎng)頁端及最新版本App支持的上下文長度已擴展至128K。開發(fā)者體驗后發(fā)現(xiàn)，穩(wěn)定性更強，推理能力有所進步。相較于之前的V3（參數(shù)量671B），V3.1（參數(shù)量685B）在模型尺寸上變化不大，但在交互體驗上有了明顯提升。此外，DeepSeek在Aider Polyglot多語言編程測試中表現(xiàn)出色，擊敗了Claude 4 Opus，并且在設計宮崎駿風格的五子棋游戲界面上展示了強大的編程能力。

在最新的DeepSeek App和官網(wǎng)上，輸入框中的“深度思考（R1）”按鈕直接變成了“深度思考”。這意味著開啟深度思考模式后，DeepSeek調(diào)用的推理模型可能不再局限于R1，可能是其他新模型或V3/R1合并后的新模型。有開發(fā)者指出，此次更新將V3和R1進行了合并部署，使得部署成本大幅下降。

目前，在Huggingface上，最新更新的DeepSeek-V3.1-Base版本已經(jīng)開放源代碼，但官方并未給出具體信息，只簡單提及該模型尺寸為685B，支持BF16、F8_E4M3、F32數(shù)據(jù)類型。

盡管V3.1在用戶體驗和經(jīng)濟性上帶來了一些驚喜，但業(yè)界期待的新一代R2模型仍未出現(xiàn)。今年1月，伴隨DeepSeek R1發(fā)布并迅速引發(fā)各界關注，用戶增長迅速。隨后，各大廠商開始借鑒或集成DeepSeek，騰訊元寶、百度、360等新產(chǎn)品應運而生。國內(nèi)廠商如阿里巴巴、月之暗面、智譜等也相繼發(fā)布了新模型，并聲稱超越了DeepSeek R1。

接近DeepSeek的人士透露，R2在8月內(nèi)并無發(fā)布計劃。聯(lián)想創(chuàng)投集團高級合伙人宋春雨表示，梁文鋒對商業(yè)化不感興趣，專注于打磨基礎模型。市場對于DeepSeek的期待值愈發(fā)強烈，下一步如何在經(jīng)濟性和可用性上創(chuàng)新將成為關鍵。業(yè)內(nèi)人士認為，V3.1發(fā)布后，DeepSeek多模態(tài)模型的發(fā)布時間或許不遠了。

(責任編輯：0882)

關閉

DeepSeek又更新了，期待梁文鋒“炸場” V3.1帶來新驚喜

相關新聞

今日熱點

頻道熱點

DeepSeek又更新了，期待梁文鋒“炸場” V3.1帶來新驚喜