在人工智能領(lǐng)域,一場(chǎng)激烈的競(jìng)爭(zhēng)正在上演。去年12月,國(guó)內(nèi)大模型公司“深度求索”開(kāi)發(fā)的DeepSeek應(yīng)用推出了DeepSeek-V3,在全球AI領(lǐng)域引起了巨大反響。這款模型以極低的訓(xùn)練成本實(shí)現(xiàn)了與GPT-4等頂尖模型相媲美的性能,震驚了業(yè)界。不到一個(gè)月后,DeepSeek再次震動(dòng)全球AI圈。
隨著新模型DeepSeek-R1的推出,1月27日,Deepseek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,并在美國(guó)區(qū)超越了ChatGPT。這一消息不僅在AI圈內(nèi)引起了軒然大波,也讓廣大用戶對(duì)這款新興應(yīng)用產(chǎn)生了濃厚興趣。DeepSeek究竟好在哪?為什么能以較低的成本取得顯著效果?開(kāi)源是不是大模型未來(lái)的發(fā)展方向?
DeepSeek是一款由國(guó)內(nèi)人工智能公司研發(fā)的大型語(yǔ)言模型,它擁有強(qiáng)大的自然語(yǔ)言處理能力,能夠理解并回答用戶的問(wèn)題,就像和朋友聊天一樣自然流暢。此外,DeepSeek還能幫助用戶寫(xiě)代碼、整理資料,甚至解決復(fù)雜的數(shù)學(xué)問(wèn)題。它背后有復(fù)雜的算法和大量數(shù)據(jù)支持,能夠從海量信息中挖掘出用戶所需的內(nèi)容。
說(shuō)到類(lèi)似的大模型,人們通常會(huì)想到OpenAI開(kāi)發(fā)的ChatGPT。從2024年9月OpenAI發(fā)布o(jì)1-preview到現(xiàn)在,市場(chǎng)上已經(jīng)出現(xiàn)了許多媲美甚至超越其性能的推理模型。然而,DeepSeek之所以能夠脫穎而出,是因?yàn)樗粌H率先實(shí)現(xiàn)了媲美OpenAI-o1模型的效果,還將推理模型的成本壓縮到了極低。
這次DeepSeek再次引起關(guān)注,是因?yàn)槠湫履P虳eepSeek-R1延續(xù)了高性價(jià)比的優(yōu)勢(shì),僅用十分之一的成本就達(dá)到了GPT-o1級(jí)別的表現(xiàn)。模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan在個(gè)人社交平臺(tái)上表示,一家非美國(guó)公司正在延續(xù)OpenAI最初的使命——通過(guò)真正開(kāi)放的前沿研究賦能全人類(lèi)。游戲科學(xué)創(chuàng)始人、CEO馮驥也評(píng)價(jià)說(shuō),DeepSeek可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。臉書(shū)母公司Meta已成立專(zhuān)門(mén)小組展開(kāi)研究和學(xué)習(xí)。
北京郵電大學(xué)人工智能學(xué)院人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉認(rèn)為,DeepSeek的最大優(yōu)勢(shì)在于算法的改進(jìn)和優(yōu)化,節(jié)省了算力,減少了對(duì)大數(shù)據(jù)量的需求。以前如果說(shuō)OpenAI是“大力出奇跡”,那么DeepSeek就是“小力也可以出奇跡”——小的算力用新的方法也能取得顯著效果。南京大學(xué)人工智能學(xué)院教授俞揚(yáng)指出,DeepSeek站在前人的基礎(chǔ)上,在算法上進(jìn)行了相應(yīng)的優(yōu)化,大幅降低了訓(xùn)練成本。
值得注意的是,DeepSeek采用了完全開(kāi)源策略。曾經(jīng)OpenAI創(chuàng)立的初衷是希望以最有可能造福全人類(lèi)的方式推進(jìn)數(shù)字智能發(fā)展,但后來(lái)限制了對(duì)模型的訪問(wèn)權(quán)限。相比之下,DeepSeek的開(kāi)源策略不僅降低了用戶的使用門(mén)檻,還促進(jìn)了AI開(kāi)發(fā)者社區(qū)的協(xié)作生態(tài)。通過(guò)開(kāi)源,DeepSeek吸引了大量開(kāi)發(fā)者和研究人員的關(guān)注,共同推動(dòng)AI技術(shù)的發(fā)展。某大模型創(chuàng)業(yè)企業(yè)的CEO陳里奧認(rèn)為,這種開(kāi)放式的創(chuàng)新模式可以激發(fā)更多的創(chuàng)意和靈感,推動(dòng)AI技術(shù)的不斷進(jìn)步。
當(dāng)然,開(kāi)源也面臨著一些挑戰(zhàn)和問(wèn)題,如知識(shí)產(chǎn)權(quán)保護(hù)和維護(hù)開(kāi)源社區(qū)秩序等。俞揚(yáng)表示,開(kāi)源只是一種商業(yè)模式,實(shí)際上開(kāi)源的東西都是有版權(quán)的。因此,開(kāi)源和閉源之爭(zhēng)更多是關(guān)于哪種商業(yè)模式在特定場(chǎng)景和時(shí)代更有效。
有人把DeepSeek的成功歸功于中國(guó)技術(shù)理想主義的故事,也有不少外國(guó)人將其比喻為神秘的東方力量。但從整個(gè)AI大模型產(chǎn)業(yè)來(lái)看,DeepSeek的成功或許代表了一種全新的發(fā)展方向。劉偉指出,現(xiàn)在大模型的發(fā)展正在發(fā)生變化,DeepSeek通過(guò)算法優(yōu)化展示了即使算力不高,也能取得優(yōu)異效果,開(kāi)辟了新的方向。