2025年1月中旬,英偉達CEO黃仁勛訪問中國,從北京到深圳,再到臺中和上海,引起廣泛關(guān)注。然而,在距離英偉達上海辦公室僅200公里的杭州,一家名為深度求索(DeepSeek)的中國公司正在悄然醞釀一場足以撼動AI產(chǎn)業(yè)格局的風(fēng)暴。1月20日,DeepSeek開源了推理模型DeepSeek-R1,這一事件迅速引起了全球關(guān)注,導(dǎo)致英偉達市值一周內(nèi)蒸發(fā)了5520億美元。
DeepSeek的崛起主要得益于其在性能、價格和開源方面的三重沖擊。1月24日發(fā)布的聊天機器人競技場榜單上,DeepSeek-R1綜合排名第三,與OpenAI的ChatGPT并列,并在高難度提示詞、代碼和數(shù)學(xué)等領(lǐng)域位列第一。DeepSeek-R1的價格低得驚人,僅為競爭對手的2%~3%,且完全免費提供移動應(yīng)用和網(wǎng)頁端服務(wù)。此外,DeepSeek-R1完全開源,任何人都可以自由使用、修改、分發(fā)和商業(yè)化該模型。
著名投資公司A16z的創(chuàng)始人馬克·安德森認(rèn)為,Deepseek-R1是令人驚嘆的突破之一,而且還是開源的,堪稱給世界的一份禮物。Scale AI創(chuàng)始人亞歷山大·王表示,DeepSeek的發(fā)布可能會改變中美在AI競賽中的局勢。
華爾街對此感到焦慮,投資者開始質(zhì)疑巨頭們在算力上的投入是否值得。投行Jeffreies股票分析師Edison Lee團隊指出,美國AI企業(yè)的管理層可能面臨更大的壓力,需要回答進一步提高AI資本支出是否合理的問題。摩根大通分析師Joshua Meyers則認(rèn)為,DeepSeek的低成本并不意味著擴張的終結(jié),也不意味著不再需要更多的算力。
DeepSeek的成功部分歸功于數(shù)據(jù)蒸餾技術(shù),但這一技術(shù)在行業(yè)內(nèi)存在爭議。南洋理工大學(xué)研究人員王漢卿表示,被訓(xùn)練的模型無法真正超越“教師模型”。不過,DeepSeek-V3的創(chuàng)新不僅于此,其精簡有效的架構(gòu)和自主提出的MLA機制也降低了緩存使用。
今年春節(jié),一款名為DeepSeek R1的中國大模型在全球AI圈引起了廣泛關(guān)注。這款模型直接對標(biāo)了OpenAI去年9月發(fā)布的OpenAI o1系列模型
2025-02-10 14:32:11DeepSeek撼動AI生態(tài)游戲規(guī)則過去一周,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷