百度前首席科學(xué)家解讀DeepSeek AI新突破引發(fā)爭(zhēng)議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-31 16:00:03 鞭牛士

中國人工智能公司DeepSeek最近聲稱其新的人工智能模型性能優(yōu)于OpenAI，但構(gòu)建成本僅為后者的一小部分。這一聲明震驚了市場(chǎng)，尤其是提到其大型語言模型的訓(xùn)練成本僅為560萬美元，引發(fā)了對(duì)科技巨頭在高級(jí)AI工作負(fù)載上巨額投入的關(guān)注。由于投資者擔(dān)心DeepSeek的影響，英偉達(dá)的市值在周一蒸發(fā)近6000億美元。

然而，并非所有人都相信DeepSeek的說法。上周，DeepSeek發(fā)布了新的推理模型R1，宣稱可以與OpenAI的o1相媲美。這種模型旨在以類似人類的方式處理復(fù)雜問題。DeepSeek由專注于人工智能的量化對(duì)沖基金High-Flyer聯(lián)合創(chuàng)始人梁文鋒于2023年創(chuàng)立，專注于大型語言模型和實(shí)現(xiàn)通用人工智能（AGI）。

R1背后的技術(shù)并不新鮮，但值得注意的是，DeepSeek是首個(gè)將其部署到高性能AI模型中的公司。據(jù)稱，其功耗要求大大降低。歐亞集團(tuán)地緣技術(shù)業(yè)務(wù)總監(jiān)陸曉萌認(rèn)為，這表明發(fā)展這一行業(yè)的可能性很大，而高端芯片/資本密集型方式只是其中一種技術(shù)路徑。

DeepSeek有兩個(gè)主要系統(tǒng)：V3和R1，都是開源的，意味著底層代碼免費(fèi)且公開。V3共有6710億個(gè)參數(shù)，相比之下，專家估計(jì)OpenAI最新模型至少有1萬億個(gè)參數(shù)。DeepSeek表示，R1在多個(gè)基準(zhǔn)測(cè)試中實(shí)現(xiàn)了與o1相當(dāng)?shù)男阅?。此外，V3的訓(xùn)練成本僅為560萬美元，遠(yuǎn)低于西方競(jìng)爭(zhēng)對(duì)手。

不過，這些說法也受到了質(zhì)疑。The Futurum Group首席執(zhí)行官丹尼爾·紐曼表示，雖然這是一個(gè)巨大突破，但他對(duì)具體數(shù)字持懷疑態(tài)度。DGA Group中國區(qū)高級(jí)副總裁Paul Triolio指出，很難直接比較DeepSeek的成本和美國主要開發(fā)商的成本，因?yàn)?60萬美元僅是一次訓(xùn)練運(yùn)行的成本，總體研發(fā)成本可能更高。

DeepSeek和OpenAI都在網(wǎng)站上披露了模型計(jì)算的定價(jià)。DeepSeek每100萬個(gè)輸入標(biāo)記的成本為55美分，輸出標(biāo)記為2.19美元；而OpenAI的o1則分別為15美元和60美元。對(duì)于GPT-4o mini，OpenAI每100萬個(gè)輸入令牌收取15美分。

DeepSeek的聲明還引發(fā)了對(duì)其使用芯片真實(shí)性的爭(zhēng)論。該公司聲稱使用的是符合出口要求的Nvidia H800和A100芯片，但一些人對(duì)此表示懷疑。Scale AI首席執(zhí)行官Alexandr Wang認(rèn)為DeepSeek可能使用了被禁芯片，不過Nvidia否認(rèn)了這一說法。

業(yè)內(nèi)專家普遍認(rèn)為DeepSeek取得的成就令人印象深刻，但也有一些人對(duì)其說法表示懷疑。Oculus和Anduril的創(chuàng)始人帕爾默·盧基認(rèn)為500萬美元這個(gè)數(shù)字不實(shí)，而億萬富翁投資者維諾德·科斯拉則暗示DeepSeek可能盜用了技術(shù)。OpenAI也在審查有關(guān)DeepSeek可能不當(dāng)使用其模型數(shù)據(jù)的報(bào)告。

無論圍繞DeepSeek的爭(zhēng)議如何，人工智能科學(xué)家普遍認(rèn)為這是行業(yè)的一大進(jìn)步。Meta首席人工智能科學(xué)家Yann LeCun表示，這標(biāo)志著開源AI模型的勝利，而不是中國戰(zhàn)勝美國。他認(rèn)為DeepSeek受益于開放研究和開源，這將使整個(gè)行業(yè)受益。

(責(zé)任編輯：張蕾)

關(guān)閉

百度前首席科學(xué)家解讀DeepSeek AI新突破引發(fā)爭(zhēng)議

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)