DeepSeek讓Meta深陷恐慌中國(guó)AI逆襲硅谷

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-26 10:34:01 每日經(jīng)濟(jì)新聞

短短一個(gè)月內(nèi)，中國(guó)AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉，性能卻與OpenAI相當(dāng)，讓硅谷震驚，甚至引發(fā)了Meta內(nèi)部的恐慌，工程師們開始連夜嘗試復(fù)制DeepSeek的成果。

Scale AI創(chuàng)始人Alexander Wang在采訪中表示，DeepSeek在他們的測(cè)試中表現(xiàn)最好，與美國(guó)最好的模型相當(dāng)。他之前還提到，DeepSeek-V3是中國(guó)科技界帶給美國(guó)的一個(gè)教訓(xùn)，強(qiáng)調(diào)中國(guó)以更低的成本、更快的速度和更強(qiáng)的實(shí)力追趕上來(lái)。

國(guó)外媒體也紛紛報(bào)道了中國(guó)大模型的新進(jìn)展，認(rèn)為這對(duì)硅谷敲響了警鐘。在5000億美元的“星際之門”計(jì)劃公布之際，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型，且未使用尖端芯片，這讓人們質(zhì)疑巨額資本投入是否是最有效的方法。

一位匿名的Meta員工透露，DeepSeek-V3在基準(zhǔn)測(cè)試中已經(jīng)超越Llama 4，更令人尷尬的是，這家僅用550萬(wàn)美元訓(xùn)練預(yù)算的中國(guó)公司做到了這一點(diǎn)。Meta的工程師們正在爭(zhēng)分奪秒地分析DeepSeek，試圖復(fù)制其中的技術(shù)。管理層則為GenAI研發(fā)部門的巨額投入而發(fā)愁，尤其是當(dāng)一個(gè)高管的薪資就超過(guò)訓(xùn)練整個(gè)DeepSeek V3的成本時(shí)。

去年12月27日，DeepSeek推出開源模型DeepSeek-V3，在聊天機(jī)器人競(jìng)技場(chǎng)中排名第七，在開源模型中排第一，是全球前十中性價(jià)比最高的模型。今年1月20日，DeepSeek正式開源R1推理模型，允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日，DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三，與頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域，DeepSeek-R1位列第一。在風(fēng)格控制方面，DeepSeek-R1與o1并列第一，表明其在理解和遵循用戶指令方面表現(xiàn)出色。Artificial-Analysis的初步測(cè)試顯示，DeepSeek-R1在AI分析質(zhì)量指數(shù)中取得第二高分，價(jià)格僅為o1的約三十分之一。

著名投資公司A16z的創(chuàng)始人馬克·安德森稱，Deepseek-R1是他見過(guò)最令人驚嘆的突破之一，而且還是開源的。A16z合伙人Anjney Midha也表示，DeepSeek-R1幾乎一夜之間成為美國(guó)頂尖大學(xué)研究人員的首選模型。諾獎(jiǎng)得主、“AI教父”杰弗里·辛頓認(rèn)為，中國(guó)的STEM教育比美國(guó)更好，擁有更多受過(guò)良好教育的人才，這為AI的發(fā)展提供了堅(jiān)實(shí)基礎(chǔ)。

斯坦福大學(xué)和Epoch AI的研究人員預(yù)測(cè)，到2027年，最大型的模型訓(xùn)練成本將超過(guò)10億美元。Gartner則預(yù)測(cè)，到2028年Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達(dá)5000億美元。然而，DeepSeek的低成本訓(xùn)練模式可能徹底改變這一局面。Noah"s Arc資本管理公司認(rèn)為，DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。

美股大V“THE SHORT BEAR”指出，如果擊敗OpenAI只需要5500萬(wàn)美元，那么這個(gè)行業(yè)的商業(yè)化會(huì)比很多人預(yù)想的要快很多。財(cái)經(jīng)記者Holger Zschaepitz也表示，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型，這讓人們質(zhì)疑該行業(yè)數(shù)千億美元資本支出的效用。有投資者甚至認(rèn)為，美股芯片股的股價(jià)也會(huì)面臨挑戰(zhàn)。

值得注意的是，DeepSeek-V3發(fā)布后，英偉達(dá)股價(jià)下跌了2%。而DeepSeek-R1引發(fā)海外大討論后，1月24日英偉達(dá)股價(jià)又大跌了3.12%。最近四天，國(guó)外媒體紛紛聚焦DeepSeek，并一致認(rèn)為中國(guó)大模型的新進(jìn)展為硅谷敲響了警鐘。加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta表示，DeepSeek最近發(fā)布的模型表明“AI能力沒有護(hù)城河”，中國(guó)的系統(tǒng)工程師人才庫(kù)比美國(guó)大得多，他們懂得如何充分利用計(jì)算資源來(lái)更便宜地訓(xùn)練和運(yùn)行模型。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek讓Meta深陷恐慌 中國(guó)AI逆襲硅谷

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek讓Meta深陷恐慌中國(guó)AI逆襲硅谷