不誘于譽,不恐于誹,率道而行,端然正己。帶著這十六個字,DeepSeek新版本終于問世。距離上一次更新的V3.2版本已經過去近5個月。在這期間,安索皮克的克勞德神話模型在網絡攻擊上展現(xiàn)了前所未有的能力,有機構稱其將網絡攻擊的時代從“手工化”帶到了“工業(yè)化”。GPT-Image-2也讓網友驚呼“有圖有真相”的時代已經過去。
在這個國外主流大模型平均91.4天就迭代一個版本的時代,DeepSeek的長時間沉默讓很多人認為它已經落后甚至掉隊。沉默的DeepSeek讓人很不習慣——2025年初的橫空出世、用更少的算力實現(xiàn)更優(yōu)的性能、打破美西方營造的“算力焦慮”,這些標簽讓它意義非凡。因此,幾個月里關于DeepSeek-V4的市場傳聞不斷。當時,國外科技媒體稱V4模型將在今年春節(jié)發(fā)布,具有強大的編碼能力。當一家公司最核心產品的動態(tài)被匿名信源、外媒報道和券商研報所定義時,討論已偏離了技術軌道。DeepSeek官方從未對外界的消息做過任何確認,這種沉默又讓討論升級。
2月26日,事情迎來轉折。路透社稱,據知情人士透露,DeepSeek在發(fā)布V4之前沒有向美國芯片公司英偉達和超微半導體提供模型早期訪問權限,而是讓中國企業(yè)華為提前數(shù)周開展軟件適配優(yōu)化工作。這種做法打破了行業(yè)慣例。顯然,此時討論的已不只是一個公司能否發(fā)布新產品的問題。
此次DeepSeek與華為昇騰國產芯片體系深度適配并不令人意外。去年8月,DeepSeek發(fā)布DeepSeek-V3.1時宣布采用UE8M0 FP8 Scale參數(shù)精度,特別表示這一數(shù)據格式是針對即將發(fā)布的下一代國產芯片設計。軟件主動適配硬件特性,本質上是在為國產芯片“量體裁衣”。這背后的難度超乎想象,需要大量改寫調用芯片的軟件代碼,使其與目標系統(tǒng)在各個環(huán)節(jié)都實現(xiàn)兼容。要想一款國產芯片嵌入既有的模型訓練和推理體系,并達到可用、好用、能規(guī)模化使用的狀態(tài),往往需要長期摸索。當國產芯片開始在具體場景里能夠接住原本由外國芯片承擔的計算任務,企業(yè)就可以不再依賴特定進口型號。
2025年12月31日,國家發(fā)展改革委召開了年度最后一場新聞發(fā)布會。會上,有記者問到國產算力水平。發(fā)言人回應稱,目前國產芯片產品在不同場景中加速適配,應用成效非常好。特別是“超節(jié)點”等集群互聯(lián)技術的發(fā)展,為國產算力趕上國際領先水平提供了良好機遇。從“回應不多”到“正面回應”,轉變在持續(xù)發(fā)生。科技與戰(zhàn)略風云學會副會長陳經表示,從去年開始,國產芯片的需求端被真正拉動起來。2025年,國產AI芯片的國內市場份額已達41%左右。上海財經大學胡延平教授提到,從去年開始,國產AI芯片企業(yè)開始集中上市。其意義不僅在于市值水平,還在于企業(yè)能夠把更多資源投向下一代AI訓練、推理芯片的研發(fā)。從技術產品到市場應用,再回到資本支持,一個相對完整的正態(tài)循環(huán)正在形成。
北京郵電大學人機交互與認知工程實驗室主任劉偉認為,模型加上芯片是人工智能競爭更進一步的形態(tài)。未來的AI發(fā)展不僅在于算法的好壞,還要看整個生態(tài)是否具有韌性。主流的英偉達生態(tài)將硬件、軟件和開發(fā)者深度綁定,形成了事實上的行業(yè)標準,在中國大模型訓練芯片市場的占比一度高達95%。幾乎所有頂級大模型都必須基于CUDA框架運行?,F(xiàn)在國產AI芯片面臨兩個選擇:一是兼容CUDA生態(tài),降低遷移成本;二是自研軟件棧,重構開發(fā)體系。中國大模型要想實現(xiàn)真正的自主,就必須形成軟硬件一體化的協(xié)同能力。DeepSeek-V4模型在適配昇騰芯片后實現(xiàn)了高吞吐、低時延的推理部署。這是技術上的新探索,也是我們在軟硬件協(xié)同領域的一種進步信號。今年初,智譜GLM-5也宣布完成與7家主流國產芯片平臺的深度適配,可以在國產算力集群之上實現(xiàn)穩(wěn)定運行。一些企業(yè)的大模型訓練過程基于國產算力體系完成。這意味著一套國產軟硬件協(xié)同的AI研發(fā)生態(tài)正在逐漸完善。盡管當前中國的制程不占優(yōu)、單卡性能有限,但我們也會通過系統(tǒng)設計、集群架構、軟硬件協(xié)同、電力能耗等優(yōu)勢排布,在既有條件下探索新的發(fā)展解法。當我們討論中國AI企業(yè)時,我們討論的其實不只是企業(yè)本身,更是一個行業(yè),以及背后代表的一種發(fā)展模式。正如那十六個字的后半句所說:率道而行,端然正己。中國AI需要活在自己的節(jié)奏里。
近期,國內多家科技企業(yè)完成了開源大模型的迭代升級。這些升級覆蓋了技術降本、工業(yè)級應用、專項能力突破及端側適配等多個核心方向,實現(xiàn)了多維度的技術進步
2026-04-28 08:02:56國產開源大模型下載量破100億次