2025年初,DeepSeek發(fā)布了R1,引起了巨大震動(dòng)。英偉達(dá)單日蒸發(fā)6000億美元,黃仁勛的財(cái)富迅速縮水。全球科技媒體集體失語三天后,用同一個(gè)詞描述他們看到的東西:震撼。
一年多后,DeepSeek再次發(fā)布新旗艦V4。這一次,市場反應(yīng)精準(zhǔn)而克制。中芯國際漲了12%,華虹漲了19%,智譜跌了10%。這表明DeepSeek已經(jīng)不再是一個(gè)“意外”,而是成為一種“預(yù)期”。
過去三個(gè)月,AI行業(yè)的發(fā)布節(jié)奏失控。Claude、GPT、元寶、千問等大模型紛紛更新,連一向低調(diào)的Gemini也開始在發(fā)布會(huì)上鼓掌熱場。每家公司都在宣稱自己最強(qiáng),對(duì)手落后三到六個(gè)月。有趣的是,DeepSeek也說V4落后閉源模型三到六個(gè)月。
外界的第一反應(yīng)是覺得這家公司被卷到了不得不發(fā)布新產(chǎn)品。但這個(gè)判斷可能是錯(cuò)的。DeepSeek在發(fā)布聲明里寫“歡迎來到百萬token上下文的時(shí)代”,語氣更像是宣布自己打開了一扇門,而不是匆忙翻過一堵墻。更重要的是,DeepSeek給出的核心信號(hào)是成本路線圖,表示等到華為昇騰950系列芯片驅(qū)動(dòng)的算力集群上線,V4的價(jià)格將大幅下降。這表明DeepSeek已經(jīng)想好了下半場棋局。
理解V4,必須先理解DeepSeek的基本哲學(xué):不爭第一,爭最劃算。V4 Pro的參數(shù)規(guī)模達(dá)到1.6萬億,但每次推理實(shí)際激活的只有490億。這種混合專家架構(gòu)(MoE)的本質(zhì)是按需調(diào)用,大幅壓縮推理成本,性能卻不打折扣。同時(shí),V4還將上下文窗口擴(kuò)展到了100萬token,可以一次處理大量數(shù)據(jù),減少了分段喂給AI的工作量。
然而,這些技術(shù)優(yōu)勢(shì)正在變得越來越難以構(gòu)成護(hù)城河。百萬token上下文和MoE架構(gòu)已經(jīng)被多家實(shí)驗(yàn)室采用。代碼基準(zhǔn)測試第一的位置頻繁更迭。Union Bancaire Privee的分析師指出,當(dāng)所有模型都足夠好時(shí),“最好”這個(gè)詞就失去了意義。接下來的競爭在于價(jià)格、生態(tài)、信任以及誰能將AI融入人們每天必須使用的東西中。