英偉達(dá)2026年的首場(chǎng)重頭戲比以往來(lái)得更早。當(dāng)?shù)貢r(shí)間1月5日,在美國(guó)CES上,黃仁勛提前發(fā)布了下一代AI芯片平臺(tái)“Rubin”,打破了英偉達(dá)通常在每年3月GTC大會(huì)上集中公布新一代架構(gòu)的傳統(tǒng)。
AI競(jìng)賽進(jìn)入推理時(shí)代,英偉達(dá)決定加速出擊。早在2025年3月的GTC大會(huì)上,黃仁勛就已預(yù)告了代號(hào)“Vera Rubin”的超級(jí)芯片,并明確其將于2026年量產(chǎn)。此次在CES上,黃仁勛對(duì)Rubin平臺(tái)進(jìn)行了系統(tǒng)性發(fā)布,Rubin成為英偉達(dá)最新GPU的代號(hào)。
黃仁勛表示:“Rubin的到來(lái)正逢其時(shí)。無(wú)論是訓(xùn)練還是推理,AI對(duì)計(jì)算的需求都在急劇攀升?!彼麖?qiáng)調(diào),通過六顆全新芯片的極致協(xié)同設(shè)計(jì),Rubin正在向AI的下一個(gè)前沿邁出巨大一步。Rubin平臺(tái)采用極端協(xié)同設(shè)計(jì)理念,整合了NVIDIA Vera CPU、Rubin GPU、NVLink 6交換芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太網(wǎng)交換芯片,覆蓋了從計(jì)算、網(wǎng)絡(luò)到存儲(chǔ)與安全的多個(gè)層級(jí)。
相比前代Blackwell架構(gòu),Rubin加速器在AI訓(xùn)練性能上提升3.5倍,運(yùn)行性能提升5倍,并配備擁有88個(gè)核心的新款中央處理器(CPU)。與Blackwell平臺(tái)相比,Rubin平臺(tái)可將推理token成本降低最高90%,并將訓(xùn)練混合專家(MoE)模型所需的GPU數(shù)量減少75%。
與此同時(shí),Vera Rubin NVL72機(jī)柜級(jí)系統(tǒng)和平臺(tái)同步發(fā)布。英偉達(dá)高管指出,NVL72指的是72個(gè)GPU封裝單元,每個(gè)封裝內(nèi)部包含2個(gè)Rubin Die,因此系統(tǒng)中實(shí)際包含144個(gè)Rubin Die。在生態(tài)層面,Rubin已獲得AWS、Microsoft、Google、OpenAI等頭部云廠商和模型公司的積極響應(yīng)。
關(guān)于產(chǎn)品發(fā)布節(jié)奏的變化,英偉達(dá)高管回應(yīng)稱,目前構(gòu)成Vera Rubin平臺(tái)的六顆芯片已經(jīng)全部到位,相關(guān)系統(tǒng)已在運(yùn)行真實(shí)應(yīng)用負(fù)載,并取得了積極結(jié)果。此次在CES上提前披露Rubin,主要是為了盡早向生態(tài)伙伴提供工程樣品,方便其為后續(xù)部署和規(guī)?;瘧?yīng)用做準(zhǔn)備。Rubin仍將按照既定節(jié)奏推進(jìn),計(jì)劃在今年下半年進(jìn)入量產(chǎn)爬坡階段。
11月5日,主題為“涌現(xiàn) Emergence”的2025小鵬科技日在廣州小鵬科技園舉行
2025-11-06 22:09:01小鵬科技日