DeepSeek 小力出奇跡低成本高性能引發(fā)關(guān)注

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 21:51:57 湖南日?qǐng)?bào)

在人工智能領(lǐng)域，一場(chǎng)激烈的競(jìng)爭(zhēng)正在上演。去年12月，國(guó)內(nèi)大模型公司“深度求索”開(kāi)發(fā)的DeepSeek應(yīng)用推出了DeepSeek-V3，在全球AI領(lǐng)域引起了巨大反響。這款模型以極低的訓(xùn)練成本實(shí)現(xiàn)了與GPT-4等頂尖模型相媲美的性能，震驚了業(yè)界。不到一個(gè)月后，DeepSeek再次震動(dòng)全球AI圈。

隨著新模型DeepSeek-R1的推出，1月27日，Deepseek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜，并在美國(guó)區(qū)超越了ChatGPT。這一消息不僅在AI圈內(nèi)引起了軒然大波，也讓廣大用戶對(duì)這款新興應(yīng)用產(chǎn)生了濃厚興趣。DeepSeek究竟好在哪？為什么能以較低的成本取得顯著效果？開(kāi)源是不是大模型未來(lái)的發(fā)展方向？

DeepSeek是一款由國(guó)內(nèi)人工智能公司研發(fā)的大型語(yǔ)言模型，它擁有強(qiáng)大的自然語(yǔ)言處理能力，能夠理解并回答用戶的問(wèn)題，就像和朋友聊天一樣自然流暢。此外，DeepSeek還能幫助用戶寫(xiě)代碼、整理資料，甚至解決復(fù)雜的數(shù)學(xué)問(wèn)題。它背后有復(fù)雜的算法和大量數(shù)據(jù)支持，能夠從海量信息中挖掘出用戶所需的內(nèi)容。

說(shuō)到類(lèi)似的大模型，人們通常會(huì)想到OpenAI開(kāi)發(fā)的ChatGPT。從2024年9月OpenAI發(fā)布o(jì)1-preview到現(xiàn)在，市場(chǎng)上已經(jīng)出現(xiàn)了許多媲美甚至超越其性能的推理模型。然而，DeepSeek之所以能夠脫穎而出，是因?yàn)樗粌H率先實(shí)現(xiàn)了媲美OpenAI-o1模型的效果，還將推理模型的成本壓縮到了極低。

這次DeepSeek再次引起關(guān)注，是因?yàn)槠湫履Ｐ虳eepSeek-R1延續(xù)了高性價(jià)比的優(yōu)勢(shì)，僅用十分之一的成本就達(dá)到了GPT-o1級(jí)別的表現(xiàn)。模型發(fā)布后，引發(fā)了海外AI圈眾多科技大佬的討論。例如，英偉達(dá)高級(jí)研究科學(xué)家Jim Fan在個(gè)人社交平臺(tái)上表示，一家非美國(guó)公司正在延續(xù)OpenAI最初的使命——通過(guò)真正開(kāi)放的前沿研究賦能全人類(lèi)。游戲科學(xué)創(chuàng)始人、CEO馮驥也評(píng)價(jià)說(shuō)，DeepSeek可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。臉書(shū)母公司Meta已成立專(zhuān)門(mén)小組展開(kāi)研究和學(xué)習(xí)。

北京郵電大學(xué)人工智能學(xué)院人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉認(rèn)為，DeepSeek的最大優(yōu)勢(shì)在于算法的改進(jìn)和優(yōu)化，節(jié)省了算力，減少了對(duì)大數(shù)據(jù)量的需求。以前如果說(shuō)OpenAI是“大力出奇跡”，那么DeepSeek就是“小力也可以出奇跡”——小的算力用新的方法也能取得顯著效果。南京大學(xué)人工智能學(xué)院教授俞揚(yáng)指出，DeepSeek站在前人的基礎(chǔ)上，在算法上進(jìn)行了相應(yīng)的優(yōu)化，大幅降低了訓(xùn)練成本。

值得注意的是，DeepSeek采用了完全開(kāi)源策略。曾經(jīng)OpenAI創(chuàng)立的初衷是希望以最有可能造福全人類(lèi)的方式推進(jìn)數(shù)字智能發(fā)展，但后來(lái)限制了對(duì)模型的訪問(wèn)權(quán)限。相比之下，DeepSeek的開(kāi)源策略不僅降低了用戶的使用門(mén)檻，還促進(jìn)了AI開(kāi)發(fā)者社區(qū)的協(xié)作生態(tài)。通過(guò)開(kāi)源，DeepSeek吸引了大量開(kāi)發(fā)者和研究人員的關(guān)注，共同推動(dòng)AI技術(shù)的發(fā)展。某大模型創(chuàng)業(yè)企業(yè)的CEO陳里奧認(rèn)為，這種開(kāi)放式的創(chuàng)新模式可以激發(fā)更多的創(chuàng)意和靈感，推動(dòng)AI技術(shù)的不斷進(jìn)步。

當(dāng)然，開(kāi)源也面臨著一些挑戰(zhàn)和問(wèn)題，如知識(shí)產(chǎn)權(quán)保護(hù)和維護(hù)開(kāi)源社區(qū)秩序等。俞揚(yáng)表示，開(kāi)源只是一種商業(yè)模式，實(shí)際上開(kāi)源的東西都是有版權(quán)的。因此，開(kāi)源和閉源之爭(zhēng)更多是關(guān)于哪種商業(yè)模式在特定場(chǎng)景和時(shí)代更有效。

有人把DeepSeek的成功歸功于中國(guó)技術(shù)理想主義的故事，也有不少外國(guó)人將其比喻為神秘的東方力量。但從整個(gè)AI大模型產(chǎn)業(yè)來(lái)看，DeepSeek的成功或許代表了一種全新的發(fā)展方向。劉偉指出，現(xiàn)在大模型的發(fā)展正在發(fā)生變化，DeepSeek通過(guò)算法優(yōu)化展示了即使算力不高，也能取得優(yōu)異效果，開(kāi)辟了新的方向。

(責(zé)任編輯：張蕾)

關(guān)閉

DeepSeek 小力出奇跡 低成本高性能引發(fā)關(guān)注

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek 小力出奇跡低成本高性能引發(fā)關(guān)注