DeepSeek迎來大更新新增快速與專家模式

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-04-09 08:32:19 澎湃新聞

國產(chǎn)大模型DeepSeek再次迎來重要更新。4月8日，在最新版本中，DeepSeek輸入框上方新增了“快速模式”與“專家模式”。網(wǎng)頁顯示，快速模式適合日常對(duì)話，即時(shí)響應(yīng)，支持圖片和文件中的文字識(shí)別；專家模式則擅長處理復(fù)雜問題。這是DeepSeek在官網(wǎng)頁面首次引入分層模式。

這次更新讓人們對(duì)DeepSeek即將發(fā)布的V4版本充滿期待。據(jù)外媒報(bào)道和社交媒體信息，DeepSeek很可能在今年4月正式上線V4版本。此前，3月29日至31日，DeepSeek官方網(wǎng)站連續(xù)三天出現(xiàn)不同程度的異常，涉及網(wǎng)頁對(duì)話、App及API等，故障分別持續(xù)約1小時(shí)48分、10小時(shí)13分和1小時(shí)3分。其中，3月29日晚上22點(diǎn)開始，一直到30日早上7點(diǎn)，服務(wù)出現(xiàn)長達(dá)8小時(shí)的大規(guī)模訪問異常，大量用戶遭遇頁面卡頓、反復(fù)提示“服務(wù)器繁忙”甚至功能完全中斷。外界猜測(cè)這些大規(guī)模宕機(jī)可能是由于V4更新所導(dǎo)致，但DeepSeek內(nèi)部人士未對(duì)此作出回應(yīng)。

今年1月12日，DeepSeek發(fā)布了一篇新論文《基于可擴(kuò)展查找的條件記憶：大語言模型稀疏性的新維度》，該論文由北京大學(xué)和DeepSeek共同完成。這篇論文提出了“條件記憶”這一概念，旨在解決當(dāng)前大語言模型存在的記憶力“短板”。

2月13日，有消息稱DeepSeek正在測(cè)試新的長文本模型結(jié)構(gòu)，支持1M上下文。其API服務(wù)仍為V3.2，僅支持128K上下文。當(dāng)時(shí)人們猜測(cè)，DeepSeek或?qū)⒃诖汗?jié)再次發(fā)布新模型，復(fù)刻去年春節(jié)期間的現(xiàn)象級(jí)轟動(dòng)。然而，春節(jié)AI大戰(zhàn)雖然熱鬧，但DeepSeek卻始終沒有動(dòng)靜，相關(guān)期待一度落空。

券商研報(bào)顯示，DeepSeek最新的V4模型將聚焦國產(chǎn)化。野村證券分析認(rèn)為，作為去年推出DS-V3/R1并攪動(dòng)全球AI產(chǎn)業(yè)鏈的玩家，DeepSeek的新技術(shù)布局不僅將推動(dòng)中國AI產(chǎn)業(yè)鏈創(chuàng)新周期加速，還將在算法與工程層面縮小中國與全球大模型產(chǎn)業(yè)的差距。業(yè)內(nèi)人士普遍認(rèn)為，此次V4發(fā)布對(duì)于DeepSeek來說難度頗大，要復(fù)刻去年春節(jié)期間的轟動(dòng)性頗有技術(shù)挑戰(zhàn)，因?yàn)閲a(chǎn)大模型已經(jīng)卷入深水戰(zhàn)場(chǎng)，競爭極度激烈。

4月8日，智譜正式發(fā)布了GLM-5.1，并在年內(nèi)漲價(jià)超八成后再度提價(jià)10%。調(diào)價(jià)后，GLM-5.1在Coding場(chǎng)景的緩存命中Token價(jià)格已接近Anthropic旗下Claude Sonnet4.6水平。這是國產(chǎn)大模型首次在核心場(chǎng)景實(shí)現(xiàn)與海外頭部廠商的價(jià)格對(duì)齊。一年前，國產(chǎn)大模型廠商還在以降價(jià)90%以上爭奪市場(chǎng)份額。這一轉(zhuǎn)折表明國產(chǎn)大模型不再單純依靠大幅降價(jià)爭奪市場(chǎng)，而是以性能溢價(jià)錨定國際基準(zhǔn)。

數(shù)據(jù)顯示，GLM-5.1在編程能力上繼續(xù)保持領(lǐng)先，在SWE-bench Pro、Terminal-Bench、NL2Repo三大代碼評(píng)測(cè)基準(zhǔn)的綜合平均分中，取得全球第三、國產(chǎn)第一、開源第一的成績。此外，GLM-5.1能夠在單次任務(wù)中持續(xù)、自主地工作長達(dá)8小時(shí)。

3月18日，MiniMax發(fā)布了新一代Agent旗艦大模型M2.7，首次展示了“模型自我進(jìn)化”路徑。該模型通過構(gòu)建Agent Harness體系，深度參與自身訓(xùn)練與優(yōu)化流程，在部分研發(fā)場(chǎng)景中可承擔(dān)30%—50%的工作量，并在內(nèi)部評(píng)測(cè)集上實(shí)現(xiàn)約30%的效果提升。在核心能力上，M2.7在SWE-bench Pro中取得56.22%的成績，接近國際一線水平；同時(shí)在VIBE-Pro、Terminal Bench2等真實(shí)工程測(cè)試中表現(xiàn)突出，支持端到端項(xiàng)目交付與復(fù)雜系統(tǒng)理解。辦公場(chǎng)景方面，其在GDPval-AA的ELO得分是1495，為開源模型中最高，并顯著提升Office文檔處理與多輪編輯能力。

截至8日港股午盤，智譜漲14.06%，報(bào)888.5港元，市值3961億港元。MiniMax漲6.9%，報(bào)1015港元，市值3183億港元。

(責(zé)任編輯：zx0176)

關(guān)閉

DeepSeek迎來大更新 新增快速與專家模式

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek迎來大更新新增快速與專家模式