而DeepSeek恰恰這么做了。V4這次沒有按行業(yè)慣例給英偉達(dá)早期測(cè)試權(quán)限,而是把提前適配的機(jī)會(huì)獨(dú)家開放給了華為昇騰和寒武紀(jì)。目標(biāo)是實(shí)現(xiàn)從CUDA生態(tài)到華為CANN框架的整體遷移。V4技術(shù)報(bào)告第3.1節(jié)將華為昇騰NPU與英偉達(dá)GPU并列寫進(jìn)硬件驗(yàn)證清單——這是DeepSeek官方第一次這樣做。V4的MoE專家權(quán)重和稀疏注意力索引器采用FP4精度,而FP4恰好是華為昇騰950PR芯片的原生支持精度。
這不是巧合,這是一條被悄悄鋪了很久的路。產(chǎn)業(yè)鏈的傳導(dǎo)效應(yīng)已經(jīng)顯現(xiàn)。據(jù)有關(guān)媒體報(bào)道,阿里巴巴、字節(jié)跳動(dòng)和騰訊等科技巨頭已提前下單華為新一代AI芯片,訂單規(guī)模達(dá)數(shù)十萬顆。在華為之外,寒武紀(jì)在軟硬一體生態(tài)中已完成對(duì)V4全系列的Day 0適配,適配代碼開源至GitHub社區(qū)。沐曦股份預(yù)期2026年將扭虧為盈,有望成為繼寒武紀(jì)之后另一家盈利的國(guó)產(chǎn)GPU廠商。當(dāng)DeepSeek用萬億參數(shù)級(jí)別的模型驗(yàn)證了國(guó)產(chǎn)芯片可以承載頂級(jí)大模型的推理,整個(gè)生態(tài)的底氣就變了。
并且,從更宏觀的視角看,這件事改變的不僅是芯片選型,更是AI產(chǎn)業(yè)鏈的利潤(rùn)分配邏輯。過去兩年,英偉達(dá)憑借GPU壟斷攫取了AI爆發(fā)期最豐厚的利潤(rùn),其數(shù)據(jù)中心業(yè)務(wù)毛利率長(zhǎng)期維持在70%以上。而當(dāng)一家開源模型的架構(gòu)創(chuàng)新能夠進(jìn)一步降低顯存需求,能夠跑通國(guó)產(chǎn)芯片并實(shí)現(xiàn)推理成本的大幅下降,英偉達(dá)的定價(jià)權(quán)就不再是鐵板一塊。
盡管短期內(nèi)英偉達(dá)在高端訓(xùn)練GPU和CUDA生態(tài)上的優(yōu)勢(shì)仍難替代,但推理市場(chǎng),這個(gè)遠(yuǎn)比訓(xùn)練更廣闊、更具持續(xù)性的市場(chǎng)的游戲規(guī)則正在被改寫。這就是DeepSeek“曲線救國(guó)”的邏輯:不是在單卡性能上硬碰硬,而是用系統(tǒng)級(jí)優(yōu)化、軟硬協(xié)同和架構(gòu)創(chuàng)新,重新定義了競(jìng)爭(zhēng)維度。
正如一位GPU企業(yè)人士所說,國(guó)內(nèi)廠商都是戴著“鐐銬”與英偉達(dá)同臺(tái)競(jìng)技。而V4證明了一件事:戴著鐐銬也可以起舞,甚至能跳出一支讓對(duì)方緊張的舞。