DeepSeekV4和GPT5.5誰(shuí)更強(qiáng) 性能對(duì)決引發(fā)熱議。中國(guó)人工智能公司DeepSeek發(fā)布了全新系列模型DeepSeek-V4的預(yù)覽版本,并同步開(kāi)源。該系列模型在Agent能力、世界知識(shí)與推理性能三大維度上宣稱(chēng)達(dá)到國(guó)內(nèi)及開(kāi)源領(lǐng)域的領(lǐng)先水平。
DeepSeek-V4分為Pro和Flash兩個(gè)版本,均支持百萬(wàn)(1M)token超長(zhǎng)上下文,且大幅降低了對(duì)計(jì)算和顯存的需求。API服務(wù)也已上線,開(kāi)發(fā)者只需將model參數(shù)修改為deepseek-v4-pro或deepseek-v4-flash即可調(diào)用,接口兼容OpenAI ChatCompletions與Anthropic兩套標(biāo)準(zhǔn)。
由于高端算力供給限制,目前Pro版本的服務(wù)吞吐量有限,但預(yù)計(jì)下半年隨著華為昇騰950超節(jié)點(diǎn)批量上市后,Pro版本的價(jià)格將大幅下調(diào)。昇騰CANN將在16點(diǎn)直播DeepSeek V4在昇騰平臺(tái)的首發(fā)。
此次發(fā)布與OpenAI前一天推出的GPT-5.5幾乎同步。兩款產(chǎn)品定價(jià)策略截然不同。有網(wǎng)友指出,GPT-5.5以每百萬(wàn)輸出token 30美元的價(jià)格上線,而DeepSeek V4則以MIT許可證開(kāi)源發(fā)布,這使得AI智能的成本底線發(fā)生了變化,每一家AI產(chǎn)品公司都不得不重新審視自己的利潤(rùn)結(jié)構(gòu)。網(wǎng)友Enrico評(píng)價(jià)稱(chēng)DeepSeek V4快速且智能,但他認(rèn)為每百萬(wàn)token 3.48美元的輸出價(jià)格并不便宜,不過(guò)LocalAI將推動(dòng)該模型面向更廣泛用戶(hù)群體普及。
DeepSeek-V4-Pro是本次發(fā)布的旗艦版本,官方將其定位為性能比肩頂級(jí)閉源模型。在數(shù)學(xué)、STEM及競(jìng)賽型代碼評(píng)測(cè)中,V4-Pro宣稱(chēng)超越當(dāng)前所有已公開(kāi)評(píng)測(cè)的開(kāi)源模型,并取得比肩世界頂級(jí)閉源模型的成績(jī)。在世界知識(shí)評(píng)測(cè)方面,V4-Pro大幅領(lǐng)先其他開(kāi)源模型,僅稍遜于Google的Gemini-Pro-3.1。相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng),在Agentic Coding評(píng)測(cè)中達(dá)到當(dāng)前開(kāi)源模型最佳水平。目前DeepSeek-V4已成為公司內(nèi)部員工使用的Agentic Coding模型,據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。
DeepSeek-V4-Flash定位為更快捷、經(jīng)濟(jì)的輕量化選項(xiàng)。相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌,但在推理能力上表現(xiàn)出色。由于模型參數(shù)與激活規(guī)模較小,其API服務(wù)在速度與成本上具備明顯優(yōu)勢(shì)。在Agent評(píng)測(cè)中,V4-Flash在簡(jiǎn)單任務(wù)上與V4-Pro表現(xiàn)相當(dāng),但在高難度任務(wù)上仍有差距。這一定位使V4-Flash更適合對(duì)延遲和成本敏感、任務(wù)復(fù)雜度適中的企業(yè)級(jí)應(yīng)用場(chǎng)景。
DeepSeek-V4在底層架構(gòu)上引入了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,并結(jié)合自研DSA稀疏注意力技術(shù),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,同時(shí)大幅降低了對(duì)計(jì)算資源和顯存的需求。這一創(chuàng)新使得1M上下文窗口成為DeepSeek所有官方服務(wù)的標(biāo)配。對(duì)于需要處理長(zhǎng)文檔、長(zhǎng)對(duì)話或復(fù)雜多步驟任務(wù)的企業(yè)用戶(hù)而言,這一能力的普及具有實(shí)質(zhì)性意義。降低算力消耗的同時(shí)擴(kuò)展上下文窗口,也有助于進(jìn)一步壓低推理成本,強(qiáng)化DeepSeek在性?xún)r(jià)比維度的競(jìng)爭(zhēng)優(yōu)勢(shì)。
DeepSeek表示,V4系列針對(duì)Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產(chǎn)品進(jìn)行了專(zhuān)項(xiàng)適配與優(yōu)化,在代碼任務(wù)及文檔生成任務(wù)上均有性能提升。API層面,兩款模型最大上下文長(zhǎng)度均為1M,同時(shí)支持非思考模式與思考模式。思考模式通過(guò)reasoning_effort參數(shù)設(shè)定推理強(qiáng)度,可選high或max檔位。DeepSeek建議,針對(duì)復(fù)雜Agent場(chǎng)景應(yīng)啟用思考模式并將強(qiáng)度設(shè)為max。