DeepSeek會在全球AI競爭中沉淪嗎 R1升級回應(yīng)質(zhì)疑

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-06-04 07:40:32 數(shù)據(jù)猿DataYuan

DeepSeek會在全球AI競爭中沉淪嗎 R1升級回應(yīng)質(zhì)疑。5月28日，DeepSeek小助手在官方交流群中發(fā)布通知稱，DeepSeek R1模型已完成小版本試升級，歡迎用戶前往官方網(wǎng)頁、App和小程序測試。API接口和使用方式保持不變。DeepSeek還在Huggingface上更新了DeepSeek-R1-0528版本，但這并不是從2月就開始宣傳的DeepSeek R2版本。

雖然不是DeepSeek R2，但據(jù)眾多網(wǎng)友實(shí)際測評，新版DeepSeek R1在性能和體驗(yàn)上有明顯提升。Berkeley背景的代碼測試平臺Live CodeBench顯示，DeepSeek-R1-0528當(dāng)前排名第四，不過這個榜單沒有Claude 4。X（Twitter）博主OpenRouterAI也指出，新版上下文長度更長，價格也更高。

此前5月13日，全球最大的大模型整合應(yīng)用平臺Poe發(fā)布《2025年春季人工智能模型使用趨勢》報告。報告顯示，DeepSeek R1的消息份額從2月中旬的高峰7%下降至4月底的3%，下降超過50%。Poe的報告表示，由于其他公司有競爭力的推理模型相繼發(fā)布，DeepSeek的影響力似乎已減弱。

此次R1升級版本的發(fā)布，似乎意在回應(yīng)外界質(zhì)疑，為逐漸冷卻的市場情緒重新“加溫”。此前，多家媒體曾報道稱，DeepSeek計(jì)劃在四月底至五月初發(fā)布新一代R2模型，甚至一度傳出“提前上線”的消息。

5月14日，梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁論文，詳述在DeepSeek-V3的研發(fā)過程中，如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練。人們又開始期待R2在架構(gòu)上的繼續(xù)升級，而此次R1的發(fā)布顯得比較有策略，既回應(yīng)了用戶期待，又給自己留足了升級架構(gòu)的時間。

DeepSeek創(chuàng)始人梁文鋒的故事廣為人知。他從小就展現(xiàn)出數(shù)學(xué)天賦，在浙江大學(xué)本碩畢業(yè)后，對金融產(chǎn)生了濃厚興趣，與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動量化交易中的應(yīng)用，并成功賺取了人生第一桶金。隨后，他創(chuàng)立了幻方量化，迅速在國內(nèi)量化投資領(lǐng)域嶄露頭角。

梁文鋒很早就注意到AI模型，2018年榮獲中國私募行業(yè)的最高獎項(xiàng)——金牛獎，并在頒獎典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景。他在演講中提到：“量化投資的未來，是用技術(shù)讓市場更有效率?！?/p>

2019年，幻方量化前瞻性地大規(guī)模布局AI算力，自主研發(fā)“螢火一號”訓(xùn)練平臺，投資近2億元，配備1100塊GPU。2021年，投資加碼到10億元的“螢火二號”投入使用，搭載約1萬張英偉達(dá)A100顯卡。憑借這些前期準(zhǔn)備，恰逢2023年AI大模型迎來爆發(fā)之年，梁文鋒宣布正式進(jìn)軍通用人工智能領(lǐng)域，創(chuàng)辦杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，即DeepSeek。

DeepSeek采用差異化的技術(shù)路線，開發(fā)了新型MLA（多頭潛在注意力機(jī)制）和MoE架構(gòu)，大幅降低顯存占用和推理成本。2024年12月26日，DeepSeek發(fā)布V3模型，使用2048顆H800 GPU，訓(xùn)練成本僅557.6萬美元，性能卻超越多個開源模型，被硅谷稱為“來自東方的神秘力量”。

2025年1月20日，DeepSeek發(fā)布R1模型，部分性能可以追趕上當(dāng)時最先進(jìn)的大模型之一OpenAI o1模型，而且完全開源。7天內(nèi)用戶增長至1億，登頂中國和美國蘋果應(yīng)用商店免費(fèi)APP榜，超越ChatGPT。R1的成功進(jìn)一步鞏固了DeepSeek的全球影響力，引發(fā)美國科技股拋售，如英偉達(dá)市值損失了6000億美元。

DeepSeek R1的發(fā)布被業(yè)內(nèi)譽(yù)為“AI的斯普特尼克時刻”，美國總統(tǒng)特朗普也給予正面評價。NVIDIA CEO黃仁勛稱其為“送給全球AI行業(yè)的禮物”，Meta首席科學(xué)家楊立昆肯定其在開源和技術(shù)優(yōu)化上的重大突破。微軟、OpenAI、亞馬遜等企業(yè)亦表達(dá)出對其技術(shù)實(shí)力的認(rèn)可。

DeepSeek的崛起標(biāo)志著中國AI正從“技術(shù)追隨者”向“自主創(chuàng)新者”轉(zhuǎn)型。然而，這種崛起引起了全球高度警惕。微軟在DeepSeek發(fā)布初期曾在其Azure云服務(wù)上提供接入，但隨后迅速轉(zhuǎn)變態(tài)度，封殺DeepSeek相關(guān)服務(wù)。OpenAI也公開指控DeepSeek使用“蒸餾技術(shù)”，涉嫌違反服務(wù)條款，并向美國政府提交信函，建議實(shí)施AI出口管制。

針對DeepSeek的新情況，美國多個政府部門開始采取限制措施。參議員喬什·霍利提出《美國人工智能能力與中國脫鉤法案》，明確禁止美國個人或機(jī)構(gòu)下載、使用DeepSeek開發(fā)的應(yīng)用程序。其他國家和地區(qū)也出于國家安全、數(shù)據(jù)隱私和技術(shù)主權(quán)的考量，禁止在政府機(jī)構(gòu)、公共部門或關(guān)鍵基礎(chǔ)設(shè)施設(shè)備上安裝或運(yùn)行DeepSeek的相關(guān)應(yīng)用與模型。

對此，中國外交部發(fā)言人郭嘉昆回應(yīng)道，中國政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全。DeepSeek通過主動公開其模型代碼、技術(shù)論文及訓(xùn)練細(xì)節(jié)，以及學(xué)術(shù)界背書，試圖緩解國際社會的質(zhì)疑和壓力。然而，這些應(yīng)對策略尚不能阻止上述國家的政府設(shè)備禁令、歐盟的監(jiān)管調(diào)查以及安全漏洞爭議。

在5月28日重新回到公眾視線之前，DeepSeek經(jīng)歷了長達(dá)三個月的沉寂期。盡管外界對梁文鋒的動向和團(tuán)隊(duì)的進(jìn)展一無所知，但競爭對手的行動并未停滯。OpenAI很快發(fā)布了o3系列模型，顯著提升了數(shù)學(xué)、科學(xué)和復(fù)雜推理任務(wù)中的表現(xiàn)。Anthropic則于2月推出Claude 3.7 Sonnet，并在5月23日推出了Claude Opus 4和Claude Sonnet 4。Google也在2025年5月的Google I/O大會上發(fā)布了Gemini 2.5 Pro和Flash版本，表現(xiàn)出色。

DeepSeek R1目前已下滑至權(quán)威大模型評測平臺Chatbot Arena LLM Leaderboard的第9位。根據(jù)手機(jī)下載排名權(quán)威網(wǎng)站Sensor Tower旗下的Data.ai顯示，DeepSeek在全球下載排名中穩(wěn)定在第11位，但在用戶活躍度、使用時長等排名中，前100名均看不到DeepSeek的身影。

DeepSeek市場份額的下滑并非偶然。綜合業(yè)內(nèi)分析與實(shí)測反饋，原因大致可歸結(jié)為：新旗艦?zāi)Ｐ涂焖傩Q食舊模型；DeepSeek R1的推理速度慢；與大廠生態(tài)基本沒有綁定。然而，R1 0528版本的發(fā)布展示了DeepSeek在深度思考能力和復(fù)雜推理任務(wù)方面的顯著提升。DeepSeek通過MIT協(xié)議開源R1并構(gòu)建開放生態(tài)來重塑其國際形象，雖然尚未形成類似Meta Llama那樣的“飛輪效應(yīng)”，但如果DeepSeek在性能和工具鏈方面進(jìn)一步實(shí)現(xiàn)突破，并提供更加友好的部署與微調(diào)能力，或許有機(jī)會繞開主流市場封鎖，從全球開發(fā)者群體走出一條非典型的國際增長曲線。

未來的征程將是一場圍繞信任與生態(tài)的系統(tǒng)性博弈。DeepSeek的技術(shù)突破固然打開了通往全球的大門，但能否穿越復(fù)雜的國際環(huán)境、以透明實(shí)踐贏得信任，并構(gòu)建真正開放協(xié)作的全球AI生態(tài)，才是其能否引領(lǐng)下一波人工智能浪潮的關(guān)鍵所在。

(責(zé)任編輯：0882)

關(guān)閉

DeepSeek會在全球AI競爭中沉淪嗎 R1升級回應(yīng)質(zhì)疑

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)