DeepSeek“刷屏”硅谷背后中國AI崛起引發(fā)恐慌

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 08:52:31 每日經(jīng)濟新聞

短短一個月內(nèi)，中國AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型：DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉，性能卻與OpenAI相當，引發(fā)了硅谷的震動，甚至讓Meta內(nèi)部陷入恐慌，工程師們開始連夜嘗試復(fù)制DeepSeek的成果。

Scale AI創(chuàng)始人Alexander Wang在采訪中表示，DeepSeek在他們的測試中表現(xiàn)最佳，與美國最好的模型相當。他之前曾評價說，DeepSeek-V3是中國科技界帶給美國的一個苦澀教訓(xùn)，指出當美國休息時，中國科技界以更低的成本、更快的速度和更強的實力迎頭趕上。

中國AI的新進展也引起了國外媒體的關(guān)注，他們認為這些新進展為硅谷敲響了警鐘。特別是在5000億美元的“星際之門”計劃公布之際，DeepSeek以極低的價格建立了一個突破性的AI模型，且沒有使用尖端芯片，這讓人們質(zhì)疑巨額資本投入是否真的是最有效的方法。

一名Meta員工在匿名平臺teamblind上發(fā)帖稱，由于DeepSeek-V3的表現(xiàn)，Meta已經(jīng)進入恐慌模式。DeepSeek-V3在基準測試中超越了Llama 4，而其訓(xùn)練預(yù)算僅為550萬美元。Meta工程師們正爭分奪秒地分析DeepSeek的技術(shù)，試圖復(fù)制其成果。管理層則因GenAI研發(fā)部門的巨額投入感到焦慮，因為一個高管的薪資就超過了整個DeepSeek V3的訓(xùn)練成本。

去年12月27日，DeepSeek推出了開源模型DeepSeek-V3，在聊天機器人競技場排名第七，在開源模型中排名第一，并被認為是全球前十中性價比最高的模型。今年1月20日，DeepSeek正式開源R1推理模型，允許所有人遵循MIT License蒸餾R1訓(xùn)練其他模型。1月24日，DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三，與頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域，DeepSeek-R1表現(xiàn)出色，風(fēng)格控制方面也與o1并列第一。

著名投資公司A16z的創(chuàng)始人馬克·安德森稱贊Deepseek-R1是令人驚嘆的突破之一，而且還是開源的。諾獎得主、“AI教父”杰弗里·辛頓認為，中國的STEM教育比美國更好，擁有更多受過良好教育的人才，這為AI的發(fā)展提供了堅實的基礎(chǔ)。盡管美國試圖通過限制英偉達芯片來減緩中國的發(fā)展，但這只會促使中國加速發(fā)展自己的技術(shù)。

斯坦福大學(xué)和Epoch AI的研究人員預(yù)測，到2027年，最大型模型的訓(xùn)練成本將超過10億美元。但DeepSeek完全不同，它的訓(xùn)練成本并不昂貴，有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。有投資者甚至認為，美股芯片股的股價也會面臨挑戰(zhàn)。

最近四天，國外媒體紛紛聚焦DeepSeek，并一致認為中國大模型的新進展為硅谷敲響了警鐘。Business Insider報道稱，DeepSeek-R1模型秉承開放精神，完全開源，給美國AI玩家?guī)砹寺闊?。CNBC邀請Perplexity CEO Aravind Srinivas分析為何DeepSeek會引發(fā)人們對美國在AI領(lǐng)域的全球領(lǐng)先地位是否正在縮小的擔(dān)憂。英國《金融時報》報道，加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta指出，中國的系統(tǒng)工程師人才庫比美國大得多，能夠更便宜地訓(xùn)練和運行模型。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek“刷屏”硅谷背后 中國AI崛起引發(fā)恐慌

相關(guān)新聞

今日熱點

頻道熱點

DeepSeek“刷屏”硅谷背后中國AI崛起引發(fā)恐慌