國產(chǎn)大模型DeepSeek再次迎來重要更新。4月8日,在最新版本中,DeepSeek輸入框上方新增了“快速模式”與“專家模式”。網(wǎng)頁顯示,快速模式適合日常對(duì)話,即時(shí)響應(yīng),支持圖片和文件中的文字識(shí)別;專家模式則擅長處理復(fù)雜問題。這是DeepSeek在官網(wǎng)頁面首次引入分層模式。
這次更新讓人們對(duì)DeepSeek即將發(fā)布的V4版本充滿期待。據(jù)外媒報(bào)道和社交媒體信息,DeepSeek很可能在今年4月正式上線V4版本。此前,3月29日至31日,DeepSeek官方網(wǎng)站連續(xù)三天出現(xiàn)不同程度的異常,涉及網(wǎng)頁對(duì)話、App及API等,故障分別持續(xù)約1小時(shí)48分、10小時(shí)13分和1小時(shí)3分。其中,3月29日晚上22點(diǎn)開始,一直到30日早上7點(diǎn),服務(wù)出現(xiàn)長達(dá)8小時(shí)的大規(guī)模訪問異常,大量用戶遭遇頁面卡頓、反復(fù)提示“服務(wù)器繁忙”甚至功能完全中斷。外界猜測(cè)這些大規(guī)模宕機(jī)可能是由于V4更新所導(dǎo)致,但DeepSeek內(nèi)部人士未對(duì)此作出回應(yīng)。
今年1月12日,DeepSeek發(fā)布了一篇新論文《基于可擴(kuò)展查找的條件記憶:大語言模型稀疏性的新維度》,該論文由北京大學(xué)和DeepSeek共同完成。這篇論文提出了“條件記憶”這一概念,旨在解決當(dāng)前大語言模型存在的記憶力“短板”。
2月13日,有消息稱DeepSeek正在測(cè)試新的長文本模型結(jié)構(gòu),支持1M上下文。其API服務(wù)仍為V3.2,僅支持128K上下文。當(dāng)時(shí)人們猜測(cè),DeepSeek或?qū)⒃诖汗?jié)再次發(fā)布新模型,復(fù)刻去年春節(jié)期間的現(xiàn)象級(jí)轟動(dòng)。然而,春節(jié)AI大戰(zhàn)雖然熱鬧,但DeepSeek卻始終沒有動(dòng)靜,相關(guān)期待一度落空。
券商研報(bào)顯示,DeepSeek最新的V4模型將聚焦國產(chǎn)化。野村證券分析認(rèn)為,作為去年推出DS-V3/R1并攪動(dòng)全球AI產(chǎn)業(yè)鏈的玩家,DeepSeek的新技術(shù)布局不僅將推動(dòng)中國AI產(chǎn)業(yè)鏈創(chuàng)新周期加速,還將在算法與工程層面縮小中國與全球大模型產(chǎn)業(yè)的差距。業(yè)內(nèi)人士普遍認(rèn)為,此次V4發(fā)布對(duì)于DeepSeek來說難度頗大,要復(fù)刻去年春節(jié)期間的轟動(dòng)性頗有技術(shù)挑戰(zhàn),因?yàn)閲a(chǎn)大模型已經(jīng)卷入深水戰(zhàn)場(chǎng),競爭極度激烈。
4月8日,智譜正式發(fā)布了GLM-5.1,并在年內(nèi)漲價(jià)超八成后再度提價(jià)10%。調(diào)價(jià)后,GLM-5.1在Coding場(chǎng)景的緩存命中Token價(jià)格已接近Anthropic旗下Claude Sonnet4.6水平。這是國產(chǎn)大模型首次在核心場(chǎng)景實(shí)現(xiàn)與海外頭部廠商的價(jià)格對(duì)齊。一年前,國產(chǎn)大模型廠商還在以降價(jià)90%以上爭奪市場(chǎng)份額。這一轉(zhuǎn)折表明國產(chǎn)大模型不再單純依靠大幅降價(jià)爭奪市場(chǎng),而是以性能溢價(jià)錨定國際基準(zhǔn)。
數(shù)據(jù)顯示,GLM-5.1在編程能力上繼續(xù)保持領(lǐng)先,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代碼評(píng)測(cè)基準(zhǔn)的綜合平均分中,取得全球第三、國產(chǎn)第一、開源第一的成績。此外,GLM-5.1能夠在單次任務(wù)中持續(xù)、自主地工作長達(dá)8小時(shí)。
3月18日,MiniMax發(fā)布了新一代Agent旗艦大模型M2.7,首次展示了“模型自我進(jìn)化”路徑。該模型通過構(gòu)建Agent Harness體系,深度參與自身訓(xùn)練與優(yōu)化流程,在部分研發(fā)場(chǎng)景中可承擔(dān)30%—50%的工作量,并在內(nèi)部評(píng)測(cè)集上實(shí)現(xiàn)約30%的效果提升。在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成績,接近國際一線水平;同時(shí)在VIBE-Pro、Terminal Bench2等真實(shí)工程測(cè)試中表現(xiàn)突出,支持端到端項(xiàng)目交付與復(fù)雜系統(tǒng)理解。辦公場(chǎng)景方面,其在GDPval-AA的ELO得分是1495,為開源模型中最高,并顯著提升Office文檔處理與多輪編輯能力。
截至8日港股午盤,智譜漲14.06%,報(bào)888.5港元,市值3961億港元。MiniMax漲6.9%,報(bào)1015港元,市值3183億港元。