DeepSeek以低成本和少量芯片實(shí)現(xiàn)了與OpenAI等巨頭媲美的性能,引發(fā)國際AI界的廣泛關(guān)注。這意味著如果算力不再是決定AI性能的關(guān)鍵因素,之前大量投資英偉達(dá)芯片的邏輯可能會(huì)發(fā)生變化,其他相關(guān)行業(yè)也將受到影響。一位首席經(jīng)濟(jì)學(xué)家在微博上表達(dá)了這一觀點(diǎn)。
緊接著,周一亞洲市場率先感受到了“東方神秘力量”DeepSeek帶來的沖擊。A股中的DeepSeek概念暴漲超過11%,而算力相關(guān)的板塊如AI算力、GPU、液冷服務(wù)器和ASIC芯片等均大跌超3%。光芯片、高速銅互聯(lián)、光通信和光模塊等板塊跌幅更是達(dá)到5%以上。日本半導(dǎo)體ETF也下跌了超過3%。
實(shí)際上,DeepSeek帶來的焦慮甚至恐慌更多地體現(xiàn)在美國市場。周一納斯達(dá)克期貨跌近3%,計(jì)劃為美國AI投資千億美元的軟銀股價(jià)暴跌6%。市場擔(dān)心的問題不僅是中國AI技術(shù)追趕甚至超越美國,還包括對(duì)DeepSeek高效訓(xùn)練方法的驚愕。這引發(fā)了關(guān)于美國科技巨頭囤積GPU的意義、英偉達(dá)市值的真實(shí)價(jià)值以及美國政府管制先進(jìn)AI芯片出口效果的質(zhì)疑。
令人驚訝的是,在中國獲取先進(jìn)AI芯片受到嚴(yán)格限制的情況下,一家成立僅一年半且去年才推出首款大模型的年輕公司能夠給全球市場帶來如此震撼。該公司沒有迷信傳統(tǒng)的“大力出奇跡”的尺度定律,而是專注于創(chuàng)新訓(xùn)練方法,減少了對(duì)計(jì)算資源的需求。
去年12月,DeepSeek發(fā)布了新一代開源大模型DeepSeek-v3,其能力接近閉源的GPT-4,但訓(xùn)練成本僅為557.6萬美元,使用了2048張英偉達(dá)H800 AI芯片。相比之下,類似能力的模型通常需要1.6萬張GPU進(jìn)行集群訓(xùn)練,例如Meta發(fā)布的Llama-3-405B在類似的集群上花費(fèi)了3080萬GPU小時(shí),而DeepSeek僅用了約280萬GPU小時(shí)。
這種高效的訓(xùn)練方式改變了AI對(duì)先進(jìn)芯片和算力需求的邏輯。行業(yè)分析認(rèn)為,DeepSeek開源讓一些對(duì)OpenAI封閉不滿的研究者感到高興,更重要的是,它展示了中國在先進(jìn)算力受限情況下研發(fā)先進(jìn)模型的能力。
美國對(duì)中國在芯片領(lǐng)域的制裁近乎瘋狂,幾乎切斷了高端AI芯片的供應(yīng)鏈,使得國內(nèi)AI產(chǎn)業(yè)上下游公司面臨諸多挑戰(zhàn)。然而,DeepSeek依然找到了自己的發(fā)展道路,并允許研究者和開發(fā)者自由使用該模型,允許用戶對(duì)其進(jìn)行任何形式的修改和衍生創(chuàng)作。這種開放姿態(tài)為全球AI行業(yè)帶來了寶貴的資源。
封鎖和制裁還推動(dòng)了中國企業(yè)之間的聯(lián)合突圍。據(jù)報(bào)道,DeepSeek最新推出的推理模型DeepSeek-R1支持華為的昇騰平臺(tái)和MindIE推理引擎,通過“動(dòng)態(tài)精度調(diào)節(jié)”技術(shù),它們?cè)谕热蝿?wù)下性能損失僅5%,但成本下降70%。這標(biāo)志著人工智能硬件選項(xiàng)多元化的重要一步,為英偉達(dá)以GPU為中心的生態(tài)系統(tǒng)提供了另一種選擇。
盡管DeepSeek取得了顯著進(jìn)展,但它仍然是新生力量,單憑一個(gè)模型或企業(yè)無法改變中美AI科技力量的對(duì)比。市場處于信息爆炸時(shí)代,很多時(shí)候難以全面了解事情的發(fā)展全貌。例如,在訓(xùn)練成本方面,有國內(nèi)大模型頭部企業(yè)的技術(shù)負(fù)責(zé)人指出,DeepSeek-v3公布的557.6萬美元只是單次訓(xùn)練成本,實(shí)際成本可能要翻倍;而在前人試錯(cuò)后,后來者的訓(xùn)練成本會(huì)更低。
事實(shí)上,在算力和資金等環(huán)境條件嚴(yán)苛的情況下,國內(nèi)大模型廠商普遍通過軟件和算法優(yōu)化,實(shí)現(xiàn)了比國外同行低得多的訓(xùn)練和推理成本。零一萬物創(chuàng)始人李開復(fù)曾表示,他們的訓(xùn)練成本只有OpenAI的3%,推理價(jià)格是OpenAI的四十分之一。
有業(yè)內(nèi)人士指出,大模型非常怕被抄襲,第一個(gè)突破的人需要付出巨大成本,而后來者只需付出較少成本就能獲得相似效果。因此,跟隨戰(zhàn)略長期有效。但中國AI產(chǎn)業(yè)要想迎頭趕上甚至領(lǐng)先,不能僅僅依靠跟隨,還需要實(shí)現(xiàn)更多從0到1的突破。
正如DeepSeek創(chuàng)始人梁文鋒所言,中國AI不可能永遠(yuǎn)處在跟隨的位置。他認(rèn)為,中國與美國在AI領(lǐng)域的差距不僅僅是時(shí)間上的,更在于原創(chuàng)與模仿之間的差異。中國必須有人站在技術(shù)前沿,才能真正實(shí)現(xiàn)領(lǐng)跑。