1月最后一天,DeepSeek的熱度依舊高漲。在美國(guó),無(wú)論是AI從業(yè)者還是普通民眾,都感受到了來(lái)自中國(guó)AI技術(shù)的沖擊。Anthropic CEO呼吁美國(guó)加強(qiáng)芯片管制,而OpenAI則尋求高達(dá)400億美元的融資。網(wǎng)友們利用寬松的開(kāi)源許可,制作了使用DeepSeek-R1替代OpenAI Operator的教程,無(wú)需200美元訂閱,完全免費(fèi)。
英偉達(dá)對(duì)DeepSeek贊賞有加,并宣布DeepSeek-R1正式登陸NVIDIA NIM。在單個(gè)NVIDIA HGX H200系統(tǒng)上,完整版DeepSeek-R1 671B的處理速度可達(dá)3,872 Token/秒。亞馬遜也在Amazon Bedrock和SageMaker AI中上線了DeepSeek-R1模型。微軟甚至提前將DeepSeek-R1部署在其云服務(wù)Azure上。
除了科技巨頭,初創(chuàng)公司也抓住機(jī)會(huì)。Windsurf編輯器集成了DeepSeek-R1和V3模型,在編程智能體中實(shí)現(xiàn)了R1的工具調(diào)用。Cerebras聲稱其部署的70B模型不僅比GPU快57倍,還在準(zhǔn)確率上超過(guò)了GPT-4o和o1-mini。
吳恩達(dá)認(rèn)為,圍繞DeepSeek的熱議顯示了幾個(gè)重要趨勢(shì):中國(guó)在生成式AI領(lǐng)域正在趕上美國(guó)。盡管ChatGPT推出時(shí)美國(guó)明顯領(lǐng)先,但隨著Qwen、Kimi、InternVL和DeepSeek等模型的出現(xiàn),中國(guó)的差距迅速縮小。特別是在視頻生成等領(lǐng)域,中國(guó)已展現(xiàn)出一些領(lǐng)先優(yōu)勢(shì)。
DeepSeek-R1不僅開(kāi)源了模型權(quán)重,還分享了一份詳細(xì)的技術(shù)報(bào)告。相比之下,一些美國(guó)公司通過(guò)渲染AI危險(xiǎn)來(lái)推動(dòng)法規(guī)阻止開(kāi)源發(fā)展。吳恩達(dá)指出,如果美國(guó)繼續(xù)妨礙開(kāi)源,這一環(huán)節(jié)可能由中國(guó)主導(dǎo)。
開(kāi)放權(quán)重模型加速了LLM的Token價(jià)格下降,為開(kāi)發(fā)者提供了更多選擇。例如,OpenAI的輸出價(jià)格為60美元/百萬(wàn)Token,而DeepSeek R1只需2.19美元。訓(xùn)練基礎(chǔ)模型并提供API服務(wù)充滿挑戰(zhàn),許多公司仍在尋找收回成本的方法。但在基礎(chǔ)模型之上進(jìn)行應(yīng)用開(kāi)發(fā),則充滿了商機(jī)。
關(guān)于通過(guò)擴(kuò)大模型規(guī)模推動(dòng)進(jìn)步的觀點(diǎn)很多,但DeepSeek團(tuán)隊(duì)因美國(guó)AI芯片禁令不得不在性能較低的H800 GPU上運(yùn)行模型,這促使他們?cè)趦?yōu)化方面進(jìn)行了大量創(chuàng)新。最終,模型訓(xùn)練成本(不包括研究成本)不到600萬(wàn)美元。吳恩達(dá)認(rèn)為,即使智能變得更便宜,人類仍會(huì)使用更多智能。
DeepSeek的成功引起了英特爾前CEO Pat Gelsinger的關(guān)注。他認(rèn)為,針對(duì)DeepSeek的反應(yīng)忽視了計(jì)算機(jī)發(fā)展歷程中的三個(gè)教訓(xùn):計(jì)算遵循“氣體定律”,工程的本質(zhì)是應(yīng)對(duì)約束,以及開(kāi)放終將勝利。DeepSeek展示了如何在資源受限的情況下以低得多的成本交付世界一流解決方案。此外,開(kāi)放的研究和生態(tài)系統(tǒng)對(duì)于AI的未來(lái)發(fā)展至關(guān)重要。