DeepSeek V4終于亮相。2026年4月24日,AI圈的平靜被一封發(fā)布稿打破。深度求索團(tuán)隊在官網(wǎng)和社交媒體上同步宣布:全新系列模型DeepSeek-V4預(yù)覽版正式上線并開源,即日起登錄官網(wǎng)或App即可體驗(yàn)。
這是一次略顯突然的發(fā)布。就在幾天前,硅谷還在熱議OpenAI的GPT-5.5和Anthropic的Claude Opus 4.6,全球AI領(lǐng)域的競爭早已呈現(xiàn)“萬類霜天競自由”的氣象。距離DeepSeek上一次讓全球AI行業(yè)震動已經(jīng)過去了近16個月。
時間回到2025年初。R1發(fā)布當(dāng)天,行業(yè)迅速沸騰,中國AI團(tuán)隊用不到600萬美元的算力成本訓(xùn)練出能與GPT-4正面競爭的模型,英偉達(dá)股價應(yīng)聲暴跌。那一周,DeepSeek同時登頂中美App Store下載榜首,“中國AI奇跡”的敘事鋪天蓋地。
在這近16個月的時間里,智譜和MiniMax先后登陸資本市場,市值一度沖破3000億元;豆包、Qwen密集發(fā)布新版本,頻頻登頂各類榜單;Anthropic推出Claude 4系列,OpenAI迭代至GPT-5.5。而DeepSeek在V3之后長達(dá)近16個月的時間里,只推出了幾個跑分變化不大的中間版本,外界關(guān)于“DeepSeek是否后繼乏力”的猜測此起彼伏。
DeepSeek V4的發(fā)布略顯樸素,沒有任何預(yù)熱,也沒有發(fā)布會。官方技術(shù)報告中坦誠地寫道,V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro,“發(fā)展軌跡大約滯后前沿閉源模型3至6個月”。在國內(nèi)AI發(fā)布稿里,這種主動承認(rèn)差距的寫法相當(dāng)罕見。
但真正值得關(guān)注的是V4解決了一個困擾大模型行業(yè)多年的根本問題:長上下文的成本困境。傳統(tǒng)Transformer架構(gòu)有一個致命的擴(kuò)展難題——注意力機(jī)制的計算量隨上下文長度呈平方級增長。上下文翻倍,計算量翻四倍。這意味著,把上下文從128K擴(kuò)展到100萬token,理論上計算量會增長約60倍。