DeepSeek新模型讓硅谷“失眠” 開(kāi)源陣營(yíng)的“反擊夜”

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-12-04 13:38:15 澎湃

2025年年底，本以為全球大模型的話題中心已經(jīng)被Google牢牢搶走。Gemini 3 Pro上線后，在一系列權(quán)威評(píng)測(cè)中壓制所有開(kāi)源模型，閉源陣營(yíng)重新站上技術(shù)制高點(diǎn)，“開(kāi)源是不是到頭了”“Scaling Law是不是撞墻了”的聲音在業(yè)內(nèi)此起彼伏，開(kāi)源社區(qū)一度彌漫出一種隱隱的低氣壓。

就在這種節(jié)點(diǎn)上，DeepSeek沒(méi)有選擇退到邊線觀望，而是把牌一口氣攤在桌面上。12月1日，它直接拋出兩款新模型：在推理能力上對(duì)標(biāo)GPT-5、整體表現(xiàn)逼近Gemini 3 Pro的DeepSeek-V3.2，以及在數(shù)學(xué)、邏輯和復(fù)雜多輪工具調(diào)用上表現(xiàn)異常突出的Speciale版本。這既是一次集中秀肌肉，也是對(duì)“閉源新天花板”的正面回應(yīng)——而且是在算力資源并不占優(yōu)的前提下。

換句話說(shuō)，這已經(jīng)不是一次常規(guī)意義上的“版本升級(jí)”，而更像是DeepSeek對(duì)“后Scaling時(shí)代”路線的一次公開(kāi)下注：當(dāng)繼續(xù)簡(jiǎn)單堆規(guī)模不再是唯一答案，如何憑架構(gòu)和訓(xùn)練方式把差距補(bǔ)回來(lái)？如何用更少的token，跑出更像“智能體”、而不是“聊天補(bǔ)全器”的行為？以及——為何要在開(kāi)源陣營(yíng)中第一個(gè)把Agent抬到戰(zhàn)略高度？

圍繞這些問(wèn)題，DeepSeek給出了一套相對(duì)完整的技術(shù)路徑和系統(tǒng)敘事。

在大模型的第一陣營(yíng)里，開(kāi)源一直被認(rèn)為“最多追平，難以對(duì)抗”。這一次，DeepSeek-V3.2交出來(lái)的成績(jī)單，已經(jīng)不太像傳統(tǒng)意義上的追趕者。

按照DeepSeek對(duì)外披露的數(shù)據(jù)，V3.2在公開(kāi)推理類(lèi)評(píng)測(cè)中的整體表現(xiàn)，已經(jīng)可以與GPT-5同場(chǎng)對(duì)比，僅在少數(shù)項(xiàng)目上略遜于Gemini 3 Pro。在多項(xiàng)關(guān)鍵指標(biāo)上，它穩(wěn)定超越Kimi-K2-Thinking，刷新國(guó)內(nèi)開(kāi)源模型推理能力的最好紀(jì)錄。在數(shù)學(xué)計(jì)算、復(fù)雜邏輯、多步推演等任務(wù)上，V3.2已經(jīng)具備和領(lǐng)先閉源模型掰手腕的實(shí)力，基本站到了“全球第二梯隊(duì)”的前排位置。

12 3 4...全文共 7 頁(yè)下一頁(yè)

關(guān)閉

DeepSeek新模型讓硅谷“失眠” 開(kāi)源陣營(yíng)的“反擊夜”

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)