“不誘于譽(yù),不恐于誹,率道而行,端然正己?!?/p>
在DeepSeek V4預(yù)覽版本上線當(dāng)天,DeepSeek官方團(tuán)隊(duì)表示感謝每一位用戶的信任與支持。用戶的肯定、建議和期許是他們不斷探索和進(jìn)步的動(dòng)力,也讓他們始終堅(jiān)守初心,專注于不懈的創(chuàng)新。DeepSeek承諾將秉持長(zhǎng)期主義的原則理念,在嘗試與思考中踏實(shí)前行,努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近。
這些表態(tài)似乎也是對(duì)近期傳言的回應(yīng)。4月24日,全新系列模型DeepSeek-V4的預(yù)覽版本正式上線并同步開(kāi)源。DeepSeek-V4擁有百萬(wàn)字超長(zhǎng)上下文,在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開(kāi)源領(lǐng)域的領(lǐng)先。該模型分為兩個(gè)版本:deepseek-v4-pro和deepseek-v4-flash。API服務(wù)已同步更新,通過(guò)修改model_name為相應(yīng)的版本即可調(diào)用。
相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng),在AgenticCoding評(píng)測(cè)中已達(dá)當(dāng)前開(kāi)源模型最佳水平,并在其他相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的AgenticCoding模型,據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet4.5,交付質(zhì)量接近Opus4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。此外,DeepSeek-V4-Pro在世界知識(shí)測(cè)評(píng)中大幅領(lǐng)先其他開(kāi)源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro超越了所有已公開(kāi)評(píng)測(cè)的開(kāi)源模型,取得了比肩世界頂級(jí)閉源模型的成績(jī)。
相比之下,DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌,但展現(xiàn)出接近的推理能力。由于模型參數(shù)和激活更小,V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。在簡(jiǎn)單任務(wù)上,DeepSeek-V4-Flash與DeepSeek-V4-Pro旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。
值得注意的是,DeepSeek-V4開(kāi)創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeekSparseAttention),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,并且大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開(kāi)始,1M上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。