DeepSeekV4發(fā)布創(chuàng)新引領(lǐng)未來(lái)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-04-24 11:36:39 澎湃新聞

“不誘于譽(yù)，不恐于誹，率道而行，端然正己?！?/p>

在DeepSeek V4預(yù)覽版本上線當(dāng)天，DeepSeek官方團(tuán)隊(duì)表示感謝每一位用戶的信任與支持。用戶的肯定、建議和期許是他們不斷探索和進(jìn)步的動(dòng)力，也讓他們始終堅(jiān)守初心，專注于不懈的創(chuàng)新。DeepSeek承諾將秉持長(zhǎng)期主義的原則理念，在嘗試與思考中踏實(shí)前行，努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近。

這些表態(tài)似乎也是對(duì)近期傳言的回應(yīng)。4月24日，全新系列模型DeepSeek-V4的預(yù)覽版本正式上線并同步開(kāi)源。DeepSeek-V4擁有百萬(wàn)字超長(zhǎng)上下文，在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開(kāi)源領(lǐng)域的領(lǐng)先。該模型分為兩個(gè)版本：deepseek-v4-pro和deepseek-v4-flash。API服務(wù)已同步更新，通過(guò)修改model_name為相應(yīng)的版本即可調(diào)用。

相比前代模型，DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)，在AgenticCoding評(píng)測(cè)中已達(dá)當(dāng)前開(kāi)源模型最佳水平，并在其他相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的AgenticCoding模型，據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet4.5，交付質(zhì)量接近Opus4.6非思考模式，但仍與Opus4.6思考模式存在一定差距。此外，DeepSeek-V4-Pro在世界知識(shí)測(cè)評(píng)中大幅領(lǐng)先其他開(kāi)源模型，僅稍遜于頂尖閉源模型Gemini-Pro-3.1。在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中，DeepSeek-V4-Pro超越了所有已公開(kāi)評(píng)測(cè)的開(kāi)源模型，取得了比肩世界頂級(jí)閉源模型的成績(jī)。

相比之下，DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌，但展現(xiàn)出接近的推理能力。由于模型參數(shù)和激活更小，V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。在簡(jiǎn)單任務(wù)上，DeepSeek-V4-Flash與DeepSeek-V4-Pro旗鼓相當(dāng)，但在高難度任務(wù)上仍有差距。

值得注意的是，DeepSeek-V4開(kāi)創(chuàng)了一種全新的注意力機(jī)制，在token維度進(jìn)行壓縮，結(jié)合DSA稀疏注意力（DeepSeekSparseAttention），實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力，并且大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開(kāi)始，1M上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

DeepSeekV4發(fā)布 創(chuàng)新引領(lǐng)未來(lái)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeekV4發(fā)布創(chuàng)新引領(lǐng)未來(lái)