春節(jié)期間,DeepSeek成為當(dāng)之無愧的春節(jié)頂流,熱度持續(xù)高漲。在面臨巨頭企業(yè)支持和多國(guó)政府質(zhì)疑的復(fù)雜局勢(shì)下,OpenAI緊急推出了全新的推理模型o3-mini,并首次向所有用戶免費(fèi)提供該模型。不過,o3-mini的API定價(jià)仍高于DeepSeek模型。
o3-mini發(fā)布后,OpenAI CEO薩姆·阿爾特曼在Reddit上表示,他們將學(xué)習(xí)DeepSeek公開推理模型思考過程的做法,并重新考慮其閉源策略。他承認(rèn)OpenAI的領(lǐng)先優(yōu)勢(shì)已不如從前。與此同時(shí),華為云宣布與硅基流動(dòng)聯(lián)合推出基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。
SemiAnalysis的一項(xiàng)新報(bào)告揭示了DeepSeek成功的關(guān)鍵因素:擁有至少5萬塊Hopper架構(gòu)的GPU,投資超過5億美元;預(yù)訓(xùn)練成本僅為600萬美元,但不包括硬件研發(fā)和總體擁有成本;為有前途的候選人提供超過130萬美元的年薪;關(guān)鍵創(chuàng)新多頭潛注意力技術(shù)顯著降低了推理價(jià)格。
英偉達(dá)創(chuàng)始人兼CEO黃仁勛被緊急召進(jìn)美國(guó)白宮,與美國(guó)總統(tǒng)討論了DeepSeek以及收緊AI芯片出口的問題。特朗普認(rèn)為這家中國(guó)公司的出現(xiàn)意味著“美國(guó)公司不必花費(fèi)大量資金來構(gòu)建低成本AI替代品”。政府計(jì)劃在今年春天進(jìn)一步限制AI芯片出口,以確保美國(guó)及其盟友繼續(xù)擁有先進(jìn)的計(jì)算能力。
上線18天的DeepSeek日活達(dá)到1500萬,增速是ChatGPT的13倍。目前,DeepSeek依然霸榜,位列蘋果應(yīng)用商店157個(gè)國(guó)家/地區(qū)的第一名。Meta首席科學(xué)家楊立昆認(rèn)為硅谷圈子中的“常見病”是錯(cuò)位的優(yōu)越感,導(dǎo)致對(duì)其他地方創(chuàng)新的懷疑。
阿爾特曼稱贊DeepSeek是一個(gè)非常好的模型,并表示OpenAI將保持比往年更少的領(lǐng)先優(yōu)勢(shì)。OpenAI計(jì)劃展示更多模型的思考過程,并透露了一些新研究進(jìn)展,如圖像生成功能、高級(jí)語音更新、文件附加功能等。
DeepSeek的成功在于其大規(guī)模利用多標(biāo)記預(yù)測(cè)、混合專家模型和多頭潛在注意力技術(shù)。這些創(chuàng)新顯著降低了推理成本,使得DeepSeek能夠在短時(shí)間內(nèi)迅速崛起。未來,隨著研發(fā)人員進(jìn)一步優(yōu)化這一新模式,不同模型之間的能力差距可能會(huì)進(jìn)一步拉大。
DeepSeek的發(fā)布對(duì)整個(gè)行業(yè)產(chǎn)生了深遠(yuǎn)影響,改變了中美之間的AI競(jìng)爭(zhēng)格局。中國(guó)企業(yè)在開源領(lǐng)域的積極作為,促使美國(guó)重新審視其限制開源的策略。DeepSeek的橫空出世重塑了全球AI產(chǎn)業(yè)的競(jìng)爭(zhēng)版圖,各國(guó)可能需要重新審視AI發(fā)展戰(zhàn)略,加強(qiáng)投入和合作,共同推動(dòng)AI技術(shù)的進(jìn)步。