DeepSeek會在全球AI競爭中沉淪嗎 R1升級回應(yīng)質(zhì)疑。5月28日,DeepSeek小助手在官方交流群中發(fā)布通知稱,DeepSeek R1模型已完成小版本試升級,歡迎用戶前往官方網(wǎng)頁、App和小程序測試。API接口和使用方式保持不變。DeepSeek還在Huggingface上更新了DeepSeek-R1-0528版本,但這并不是從2月就開始宣傳的DeepSeek R2版本。
雖然不是DeepSeek R2,但據(jù)眾多網(wǎng)友實(shí)際測評,新版DeepSeek R1在性能和體驗(yàn)上有明顯提升。Berkeley背景的代碼測試平臺Live CodeBench顯示,DeepSeek-R1-0528當(dāng)前排名第四,不過這個榜單沒有Claude 4。X(Twitter)博主OpenRouterAI也指出,新版上下文長度更長,價格也更高。
此前5月13日,全球最大的大模型整合應(yīng)用平臺Poe發(fā)布《2025年春季人工智能模型使用趨勢》報告。報告顯示,DeepSeek R1的消息份額從2月中旬的高峰7%下降至4月底的3%,下降超過50%。Poe的報告表示,由于其他公司有競爭力的推理模型相繼發(fā)布,DeepSeek的影響力似乎已減弱。
此次R1升級版本的發(fā)布,似乎意在回應(yīng)外界質(zhì)疑,為逐漸冷卻的市場情緒重新“加溫”。此前,多家媒體曾報道稱,DeepSeek計(jì)劃在四月底至五月初發(fā)布新一代R2模型,甚至一度傳出“提前上線”的消息。
5月14日,梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁論文,詳述在DeepSeek-V3的研發(fā)過程中,如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練。人們又開始期待R2在架構(gòu)上的繼續(xù)升級,而此次R1的發(fā)布顯得比較有策略,既回應(yīng)了用戶期待,又給自己留足了升級架構(gòu)的時間。
DeepSeek創(chuàng)始人梁文鋒的故事廣為人知。他從小就展現(xiàn)出數(shù)學(xué)天賦,在浙江大學(xué)本碩畢業(yè)后,對金融產(chǎn)生了濃厚興趣,與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動量化交易中的應(yīng)用,并成功賺取了人生第一桶金。隨后,他創(chuàng)立了幻方量化,迅速在國內(nèi)量化投資領(lǐng)域嶄露頭角。
梁文鋒很早就注意到AI模型,2018年榮獲中國私募行業(yè)的最高獎項(xiàng)——金牛獎,并在頒獎典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景。他在演講中提到:“量化投資的未來,是用技術(shù)讓市場更有效率?!?/p>
2019年,幻方量化前瞻性地大規(guī)模布局AI算力,自主研發(fā)“螢火一號”訓(xùn)練平臺,投資近2億元,配備1100塊GPU。2021年,投資加碼到10億元的“螢火二號”投入使用,搭載約1萬張英偉達(dá)A100顯卡。憑借這些前期準(zhǔn)備,恰逢2023年AI大模型迎來爆發(fā)之年,梁文鋒宣布正式進(jìn)軍通用人工智能領(lǐng)域,創(chuàng)辦杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,即DeepSeek。
DeepSeek采用差異化的技術(shù)路線,開發(fā)了新型MLA(多頭潛在注意力機(jī)制)和MoE架構(gòu),大幅降低顯存占用和推理成本。2024年12月26日,DeepSeek發(fā)布V3模型,使用2048顆H800 GPU,訓(xùn)練成本僅557.6萬美元,性能卻超越多個開源模型,被硅谷稱為“來自東方的神秘力量”。
2025年1月20日,DeepSeek發(fā)布R1模型,部分性能可以追趕上當(dāng)時最先進(jìn)的大模型之一OpenAI o1模型,而且完全開源。7天內(nèi)用戶增長至1億,登頂中國和美國蘋果應(yīng)用商店免費(fèi)APP榜,超越ChatGPT。R1的成功進(jìn)一步鞏固了DeepSeek的全球影響力,引發(fā)美國科技股拋售,如英偉達(dá)市值損失了6000億美元。
DeepSeek R1的發(fā)布被業(yè)內(nèi)譽(yù)為“AI的斯普特尼克時刻”,美國總統(tǒng)特朗普也給予正面評價。NVIDIA CEO黃仁勛稱其為“送給全球AI行業(yè)的禮物”,Meta首席科學(xué)家楊立昆肯定其在開源和技術(shù)優(yōu)化上的重大突破。微軟、OpenAI、亞馬遜等企業(yè)亦表達(dá)出對其技術(shù)實(shí)力的認(rèn)可。
DeepSeek的崛起標(biāo)志著中國AI正從“技術(shù)追隨者”向“自主創(chuàng)新者”轉(zhuǎn)型。然而,這種崛起引起了全球高度警惕。微軟在DeepSeek發(fā)布初期曾在其Azure云服務(wù)上提供接入,但隨后迅速轉(zhuǎn)變態(tài)度,封殺DeepSeek相關(guān)服務(wù)。OpenAI也公開指控DeepSeek使用“蒸餾技術(shù)”,涉嫌違反服務(wù)條款,并向美國政府提交信函,建議實(shí)施AI出口管制。
針對DeepSeek的新情況,美國多個政府部門開始采取限制措施。參議員喬什·霍利提出《美國人工智能能力與中國脫鉤法案》,明確禁止美國個人或機(jī)構(gòu)下載、使用DeepSeek開發(fā)的應(yīng)用程序。其他國家和地區(qū)也出于國家安全、數(shù)據(jù)隱私和技術(shù)主權(quán)的考量,禁止在政府機(jī)構(gòu)、公共部門或關(guān)鍵基礎(chǔ)設(shè)施設(shè)備上安裝或運(yùn)行DeepSeek的相關(guān)應(yīng)用與模型。
對此,中國外交部發(fā)言人郭嘉昆回應(yīng)道,中國政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全。DeepSeek通過主動公開其模型代碼、技術(shù)論文及訓(xùn)練細(xì)節(jié),以及學(xué)術(shù)界背書,試圖緩解國際社會的質(zhì)疑和壓力。然而,這些應(yīng)對策略尚不能阻止上述國家的政府設(shè)備禁令、歐盟的監(jiān)管調(diào)查以及安全漏洞爭議。
在5月28日重新回到公眾視線之前,DeepSeek經(jīng)歷了長達(dá)三個月的沉寂期。盡管外界對梁文鋒的動向和團(tuán)隊(duì)的進(jìn)展一無所知,但競爭對手的行動并未停滯。OpenAI很快發(fā)布了o3系列模型,顯著提升了數(shù)學(xué)、科學(xué)和復(fù)雜推理任務(wù)中的表現(xiàn)。Anthropic則于2月推出Claude 3.7 Sonnet,并在5月23日推出了Claude Opus 4和Claude Sonnet 4。Google也在2025年5月的Google I/O大會上發(fā)布了Gemini 2.5 Pro和Flash版本,表現(xiàn)出色。
DeepSeek R1目前已下滑至權(quán)威大模型評測平臺Chatbot Arena LLM Leaderboard的第9位。根據(jù)手機(jī)下載排名權(quán)威網(wǎng)站Sensor Tower旗下的Data.ai顯示,DeepSeek在全球下載排名中穩(wěn)定在第11位,但在用戶活躍度、使用時長等排名中,前100名均看不到DeepSeek的身影。
DeepSeek市場份額的下滑并非偶然。綜合業(yè)內(nèi)分析與實(shí)測反饋,原因大致可歸結(jié)為:新旗艦?zāi)P涂焖傩Q食舊模型;DeepSeek R1的推理速度慢;與大廠生態(tài)基本沒有綁定。然而,R1 0528版本的發(fā)布展示了DeepSeek在深度思考能力和復(fù)雜推理任務(wù)方面的顯著提升。DeepSeek通過MIT協(xié)議開源R1并構(gòu)建開放生態(tài)來重塑其國際形象,雖然尚未形成類似Meta Llama那樣的“飛輪效應(yīng)”,但如果DeepSeek在性能和工具鏈方面進(jìn)一步實(shí)現(xiàn)突破,并提供更加友好的部署與微調(diào)能力,或許有機(jī)會繞開主流市場封鎖,從全球開發(fā)者群體走出一條非典型的國際增長曲線。
未來的征程將是一場圍繞信任與生態(tài)的系統(tǒng)性博弈。DeepSeek的技術(shù)突破固然打開了通往全球的大門,但能否穿越復(fù)雜的國際環(huán)境、以透明實(shí)踐贏得信任,并構(gòu)建真正開放協(xié)作的全球AI生態(tài),才是其能否引領(lǐng)下一波人工智能浪潮的關(guān)鍵所在。
我們需要更多的DeepSeek。過去幾年里,中國大模型從業(yè)者們經(jīng)常被問及中國距離追上ChatGPT還有多遠(yuǎn)。2025年初,這個問題有了新的答案
2025-02-21 17:49:36DeepSeek爆火蛇年除夕夜,硅基流動創(chuàng)始人袁進(jìn)輝沒有留在飯桌上,而是抓緊時間與技術(shù)團(tuán)隊(duì)開會,解決DeepSeek模型在國產(chǎn)芯片上的適配問題
2025-02-16 09:01:22DeepSeek風(fēng)暴席卷AI產(chǎn)業(yè)鏈中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動