2025年年底,本以為全球大模型的話題中心已經(jīng)被Google牢牢搶走。Gemini 3 Pro上線后,在一系列權(quán)威評(píng)測(cè)中壓制所有開(kāi)源模型,閉源陣營(yíng)重新站上技術(shù)制高點(diǎn),“開(kāi)源是不是到頭了”“Scaling Law是不是撞墻了”的聲音在業(yè)內(nèi)此起彼伏,開(kāi)源社區(qū)一度彌漫出一種隱隱的低氣壓。
就在這種節(jié)點(diǎn)上,DeepSeek沒(méi)有選擇退到邊線觀望,而是把牌一口氣攤在桌面上。12月1日,它直接拋出兩款新模型:在推理能力上對(duì)標(biāo)GPT-5、整體表現(xiàn)逼近Gemini 3 Pro的DeepSeek-V3.2,以及在數(shù)學(xué)、邏輯和復(fù)雜多輪工具調(diào)用上表現(xiàn)異常突出的Speciale版本。這既是一次集中秀肌肉,也是對(duì)“閉源新天花板”的正面回應(yīng)——而且是在算力資源并不占優(yōu)的前提下。
換句話說(shuō),這已經(jīng)不是一次常規(guī)意義上的“版本升級(jí)”,而更像是DeepSeek對(duì)“后Scaling時(shí)代”路線的一次公開(kāi)下注:當(dāng)繼續(xù)簡(jiǎn)單堆規(guī)模不再是唯一答案,如何憑架構(gòu)和訓(xùn)練方式把差距補(bǔ)回來(lái)?如何用更少的token,跑出更像“智能體”、而不是“聊天補(bǔ)全器”的行為?以及——為何要在開(kāi)源陣營(yíng)中第一個(gè)把Agent抬到戰(zhàn)略高度?
圍繞這些問(wèn)題,DeepSeek給出了一套相對(duì)完整的技術(shù)路徑和系統(tǒng)敘事。
在大模型的第一陣營(yíng)里,開(kāi)源一直被認(rèn)為“最多追平,難以對(duì)抗”。這一次,DeepSeek-V3.2交出來(lái)的成績(jī)單,已經(jīng)不太像傳統(tǒng)意義上的追趕者。
按照DeepSeek對(duì)外披露的數(shù)據(jù),V3.2在公開(kāi)推理類(lèi)評(píng)測(cè)中的整體表現(xiàn),已經(jīng)可以與GPT-5同場(chǎng)對(duì)比,僅在少數(shù)項(xiàng)目上略遜于Gemini 3 Pro。在多項(xiàng)關(guān)鍵指標(biāo)上,它穩(wěn)定超越Kimi-K2-Thinking,刷新國(guó)內(nèi)開(kāi)源模型推理能力的最好紀(jì)錄。在數(shù)學(xué)計(jì)算、復(fù)雜邏輯、多步推演等任務(wù)上,V3.2已經(jīng)具備和領(lǐng)先閉源模型掰手腕的實(shí)力,基本站到了“全球第二梯隊(duì)”的前排位置。
10月20日,人工智能團(tuán)隊(duì)DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開(kāi)源新模型DeepSeek-OCR