中國大模型刷屏 Meta進(jìn)入恐慌模式硅谷震動反思巨額投入

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-26 14:58:00 每日經(jīng)濟(jì)新聞

中國AI初創(chuàng)公司深度求索（DeepSeek）在短短一個(gè)月內(nèi)發(fā)布了兩款大模型，分別是DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉，性能卻與OpenAI相當(dāng)，引起了硅谷的震驚，甚至引發(fā)了Meta內(nèi)部的恐慌。工程師們開始連夜嘗試復(fù)制DeepSeek的成果。

Scale AI創(chuàng)始人Alexander Wang表示，在他們的測試中，DeepSeek的表現(xiàn)最佳，與美國最好的模型相當(dāng)。他之前還評價(jià)說，DeepSeek-V3是中國科技界帶給美國的一個(gè)苦澀教訓(xùn)，強(qiáng)調(diào)中國科技界以更低的成本、更快的速度和更強(qiáng)的實(shí)力追趕上來。

中國AI的新進(jìn)展引起了國外媒體的關(guān)注，認(rèn)為這些新進(jìn)展為硅谷敲響了警鐘。尤其在5000億美元的“星際之門”計(jì)劃公布之際，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型，且沒有使用尖端芯片，這讓人們質(zhì)疑巨額投入是否是最有效的方法。

一名Meta員工在匿名平臺teamblind上發(fā)帖稱，Meta內(nèi)部因?yàn)镈eepSeek的模型進(jìn)入了恐慌模式。DeepSeek-V3在基準(zhǔn)測試中已經(jīng)超越了Llama 4，而DeepSeek僅用550萬美元訓(xùn)練預(yù)算就達(dá)到了這一成就。Meta工程師們正在爭分奪秒地分析DeepSeek的技術(shù)，試圖復(fù)制其成果。管理層也為GenAI研發(fā)部門的巨額投入感到焦慮。

去年12月27日，DeepSeek推出了開源模型DeepSeek-V3，在聊天機(jī)器人競技場排名第七，在開源模型中排名第一。今年1月20日，DeepSeek正式開源R1推理模型，允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日，DeepSeek-R1在聊天機(jī)器人競技場綜合榜單上排名第三，與頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等領(lǐng)域，DeepSeek-R1表現(xiàn)優(yōu)異，位列第一。在風(fēng)格控制方面，DeepSeek-R1同樣表現(xiàn)出色，與o1并列第一。

Artificial-Analysis對DeepSeek-R1的初始基準(zhǔn)測試結(jié)果顯示，該模型在AI分析質(zhì)量指數(shù)中取得第二高分，價(jià)格僅為o1的約三十分之一。著名投資公司A16z的創(chuàng)始人馬克·安德森稱，Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一。A16z合伙人Anjney Midha也表示，DeepSeek-R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型。

對于中國AI為何能有如此快速的進(jìn)展，諾獎得主杰弗里·辛頓表示，中國的STEM教育比美國更好，擁有更多受過良好教育的人才，這為AI的發(fā)展提供了堅(jiān)實(shí)的基礎(chǔ)。盡管美國試圖通過限制來減緩中國的發(fā)展，但這只會促使中國加速發(fā)展自己的技術(shù)。

斯坦福大學(xué)和Epoch AI的研究人員發(fā)表了一項(xiàng)研究表明，到2027年，最大型的模型的訓(xùn)練成本將超過10億美元。Gartner預(yù)測，到2028年Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達(dá)5000億美元。但DeepSeek完全不同，它的訓(xùn)練成本并不昂貴。Noah"s Arc資本管理公司認(rèn)為，DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。

美股大V“THE SHORT BEAR”指出，如果擊敗OpenAI只需要5500萬美元，那么這個(gè)行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多。著名財(cái)經(jīng)記者Holger Zschaepitz也表示，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型，這讓人們質(zhì)疑數(shù)千億美元資本支出的效用。投資者Geiger Capital認(rèn)為，Deepseek和OpenAI一樣好，甚至更好，但價(jià)格只有后者的3%。

值得注意的是，DeepSeek-V3發(fā)布后，英偉達(dá)股價(jià)下跌了2%，而DeepSeek-R1引發(fā)海外大討論后，1月24日英偉達(dá)股價(jià)又大跌了3.12%。最近四天，國外媒體紛紛聚焦DeepSeek，并一致認(rèn)為中國大模型的新進(jìn)展為硅谷敲響了警鐘。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

中國大模型刷屏 Meta進(jìn)入恐慌模式 硅谷震動反思巨額投入

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

中國大模型刷屏 Meta進(jìn)入恐慌模式硅谷震動反思巨額投入