在人工智能領(lǐng)域,一場激烈的競爭正在上演。去年12月,國內(nèi)大模型公司“深度求索”開發(fā)的DeepSeek應(yīng)用推出了DeepSeek-V3,在全球AI領(lǐng)域引起了巨大反響。這款模型以極低的訓(xùn)練成本實(shí)現(xiàn)了與GPT-4等頂尖模型相媲美的性能,震驚了業(yè)界。不到一個(gè)月后,DeepSeek再次震動(dòng)全球AI圈。
隨著新模型DeepSeek-R1的推出,1月27日,Deepseek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,并在美國區(qū)超越了ChatGPT。這一消息不僅在AI圈內(nèi)引起了軒然大波,也讓廣大用戶對這款新興應(yīng)用產(chǎn)生了濃厚興趣。DeepSeek究竟好在哪?為什么能以較低的成本取得顯著效果?開源是不是大模型未來的發(fā)展方向?
DeepSeek是一款由國內(nèi)人工智能公司研發(fā)的大型語言模型,它擁有強(qiáng)大的自然語言處理能力,能夠理解并回答用戶的問題,就像和朋友聊天一樣自然流暢。此外,DeepSeek還能幫助用戶寫代碼、整理資料,甚至解決復(fù)雜的數(shù)學(xué)問題。它背后有復(fù)雜的算法和大量數(shù)據(jù)支持,能夠從海量信息中挖掘出用戶所需的內(nèi)容。
說到類似的大模型,人們通常會(huì)想到OpenAI開發(fā)的ChatGPT。從2024年9月OpenAI發(fā)布o(jì)1-preview到現(xiàn)在,市場上已經(jīng)出現(xiàn)了許多媲美甚至超越其性能的推理模型。然而,DeepSeek之所以能夠脫穎而出,是因?yàn)樗粌H率先實(shí)現(xiàn)了媲美OpenAI-o1模型的效果,還將推理模型的成本壓縮到了極低。
這次DeepSeek再次引起關(guān)注,是因?yàn)槠湫履P虳eepSeek-R1延續(xù)了高性價(jià)比的優(yōu)勢,僅用十分之一的成本就達(dá)到了GPT-o1級(jí)別的表現(xiàn)。模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan在個(gè)人社交平臺(tái)上表示,一家非美國公司正在延續(xù)OpenAI最初的使命——通過真正開放的前沿研究賦能全人類。游戲科學(xué)創(chuàng)始人、CEO馮驥也評(píng)價(jià)說,DeepSeek可能是個(gè)國運(yùn)級(jí)別的科技成果。臉書母公司Meta已成立專門小組展開研究和學(xué)習(xí)。