电竞下注-中国电竞赛事及体育赛事平台

中華網 china.com

DeepSeek V4有多強 架構創(chuàng)新引領未來(2)

關鍵詞:
2026-04-28 17:08:27  正和島

這也是為什么長期以來,百萬字上下文要么是Google Gemini的獨家王牌,要么是實驗室里的漂亮數字,太貴了,用不起。V4給出的解法是一種全新的混合注意力架構。通俗地解釋,就像你在讀一本1000頁的書時找某個觀點的關聯內容。笨辦法是把目標頁和其他999頁逐一比對,工作量隨頁數翻倍而變成四倍。聰明的辦法是:先粗略判斷哪些頁面可能相關(稀疏選擇),再把相關頁面壓縮成摘要(token壓縮),兩步疊加之后,工作量增長曲線被大幅壓平。

這正是V4的核心創(chuàng)新:CSA(壓縮稀疏注意力)和HCA(高度壓縮注意力)的混合架構。在1M上下文設置下,V4-Pro的單token推理算力只有上一代V3.2的27%,KV緩存僅需10%;更經濟的V4-Flash版本則將這兩個數字分別壓到了10%和7%。換句話說,上下文長度擴大了近8倍,但推理成本反而下降了。

V4一口氣發(fā)布兩個版本:DeepSeek-V4-Pro總參數1.6萬億、每次推理激活49B;DeepSeek-V4-Flash總參數284B、激活13B。兩者均原生支持100萬token上下文。理解這兩個數字需要先理解MoE(混合專家)架構。簡單講,V4內部有大量“專家”子網絡,每次處理信息時只激活其中一小部分??倕禌Q定知識容量,激活參數決定推理成本。這就像一家公司有1600個身懷絕技的員工,但每個項目只調49人上陣,可以按需靈活組合。

在能力評估上,DeepSeek的措辭相當克制。發(fā)布稿明確表示:V4-Pro的Agent能力優(yōu)于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與后者思考模式存在差距。在內部85名開發(fā)者和研究人員的調研中,超過九成認為V4-Pro已可作為首選或接近首選的編程模型。在數學、STEM、競賽型代碼等推理密集型任務上,V4-Pro超越所有已知開源模型,比肩頂級閉源產品;在Codeforces人類選手排行榜上,V4-Pro-Max位列第23名;但在世界知識方面——事實性信息的覆蓋廣度,僅稍遜于Gemini-Pro-3.1。這個差距來自數據:Google擁有搜索引擎索引和更大規(guī)模網頁抓取的結構性優(yōu)勢,不是算法可以短期彌補的。

關閉

中國女排0比3不敵捷克女排 賽季首秀失利

中國女排0比3不敵捷克女排2026-06-03 21:32:52

兩人幫電詐轉贓200萬現金及金條被拘 5天瘋狂作案

兩人幫電詐轉贓200萬現金及金條被拘2026-06-03 21:21:35

湖南警方通報“男子街頭毆打路人” 嫌疑人已被抓獲

湖南警方通報男子街頭毆打路人2026-06-03 21:08:19

湖南警方通報“男子街頭毆打路人” 嫌疑人已被抓獲

湖南警方通報男子街頭毆打路人2026-06-03 21:08:19

老人跳江輕生 健身教練一把拉住 的哥英勇救人

老人跳江輕生健身教練一把拉住2026-06-03 20:26:41

兩家新銀行獲批準籌建 貴州農商行體系再添新成員

兩家新銀行獲批準籌建2026-06-03 20:34:58

歐洲議會投票通過歐美貿易協(xié)議 立法文本待最終批準

歐洲議會投票通過歐美貿易協(xié)議2026-06-03 09:59:24

特朗普簽署人工智能行政令 加強AI技術監(jiān)督

特朗普簽署人工智能行政令2026-06-03 11:41:25

推遲三個月的告別:哈梅內伊國葬敲定三城舉行 三城送別最高領袖

推遲三個月的告別,哈梅內伊國葬敲定三城舉行2026-06-03 15:42:52

上海野生動物園回應老虎吃草質疑 為健康所需

上海野生動物園回應老虎吃草質疑2026-06-03 20:10:21

這些汛情信息都是假的 假消息勿傳

這些汛情信息都是假的2026-06-03 20:16:21

黃仁勛稱員工薪水越高越好 分享盈利增長紅利

黃仁勛稱員工薪水越高越好2026-06-03 09:57:14

基輔60秒內遭4枚導彈襲擊 烏克蘭經歷“最艱難一天”

基輔60秒內遭4枚導彈襲擊2026-06-03 16:10:27

中東多國拉響警報 導彈與無人機真實攻擊

中東多國拉響警報2026-06-03 11:20:40

世界杯前墨西哥城“蠑螈化”惹爭議 城市改造優(yōu)先級引討論

世界杯前墨西哥城蠑螈化惹爭議2026-06-03 20:23:57

兩人幫電詐轉贓200萬現金及金條被拘 5天瘋狂作案

兩人幫電詐轉贓200萬現金及金條被拘2026-06-03 21:21:35

烏方發(fā)布基輔遭襲畫面 多枚導彈引發(fā)爆炸傷亡慘重

烏方發(fā)布基輔遭襲畫面2026-06-03 09:57:32

哈馬斯重申:愿移交加沙地帶治理權 否認不愿交權指控

哈馬斯重申,愿移交加沙地帶治理權2026-06-03 16:06:21

中國驅逐艦隊擴張迎里程碑 45艘服役 現代化海軍崛起

中國驅逐艦隊擴張迎里程碑45艘服役2026-06-03 10:24:22

寸海不讓!那一聲怒吼背后的力量 守護藍色國土

寸海不讓,那一聲怒吼背后的力量2026-06-03 19:56:41

中國機器人“出海潮”的喜與憂 從規(guī)模到價值的跨越

中國機器人出海潮的喜與憂2026-06-03 09:56:59

30人拼單29人是托兒 起底賭石騙局 私域直播間里的圈套

30人拼單29人是托兒起底賭石騙局2026-06-03 20:52:57

我國還要自研EUV光刻機嗎 筑牢產業(yè)根基

我國還要自研EUV光刻機嗎2026-06-03 20:01:47

問界回應浙江臺州M9起火事故 非車輛自身原因導致

問界回應浙江臺州M9起火事故2026-06-03 20:27:13

黃金超越美債成最大儲備資產意味什么 全球儲備結構大變局

黃金超越美債成最大儲備資產意味什么2026-06-03 19:59:22

中國女排0比3不敵捷克女排 賽季首秀失利

中國女排0比3不敵捷克女排2026-06-03 21:32:52

女子連續(xù)多日為搶收農機手送盒飯 潁上好人溫暖田間

女子連續(xù)多日為搶收農機手送盒飯2026-06-03 19:42:52

超聚變推出企業(yè)級Token生產平臺 解鎖高效本地AI部署

超聚變推出企業(yè)級Token生產平臺2026-06-03 20:21:40

曝印尼準備買24架殲-10CE 精明采購策略揭曉

曝印尼準備買24架殲-10CE2026-06-03 16:08:26

過去一夜中東局勢驟然升級 阿聯酋倒戈引發(fā)連鎖反應

過去一夜中東局勢驟然升級2026-06-03 10:27:02

博主:中國海軍達到新里程碑 新型驅逐艦服役

博主,中國海軍達到新里程碑2026-06-03 20:16:55

歐洲民眾對自動駕駛汽車接受度較低 信任度待提升

歐洲民眾對自動駕駛汽車接受度較低2026-06-03 20:18:32

日菲炒作海域“劃界談判”目的何在 針對中方海上布局

日菲炒作海域劃界談判目的何在2026-06-03 10:25:15

俄稱烏襲擊頓涅茨克一客運汽車致7死 烏方暫無回應

俄稱烏襲擊頓涅茨克一客運汽車致7死2026-06-03 15:43:22

相關新聞