黃仁勛重新定義數(shù)字員工和物理AI!美國(guó)當(dāng)?shù)貢r(shí)間1月5日,英偉達(dá)CEO黃仁勛在拉斯維加斯楓丹白露酒店的劇場(chǎng)中心進(jìn)行了新年的首場(chǎng)演講。他依舊穿著那身標(biāo)志性的皮衣。
通常情況下,英偉達(dá)會(huì)在春季于硅谷舉行的開(kāi)發(fā)者大會(huì)上詳細(xì)介紹其最新芯片的規(guī)格和性能。然而,由于人工智能所需的計(jì)算復(fù)雜度不斷提高,以及市場(chǎng)對(duì)先進(jìn)處理器用于訓(xùn)練和運(yùn)行AI模型的巨大需求,整個(gè)半導(dǎo)體行業(yè)不得不加快步伐。
在總結(jié)2025年的變化時(shí),黃仁勛特別提到了DeepSeek R1的出現(xiàn)所起到的催化劑作用,并展示了中國(guó)開(kāi)源模型Kimi K2和Qwen。這場(chǎng)持續(xù)一個(gè)半小時(shí)的演講信息量極大,涵蓋了Agentic AI、物理AI和新芯片三大關(guān)鍵詞。
此次大會(huì)上,英偉達(dá)發(fā)布了一套由六個(gè)部分組成的Rubin平臺(tái),包括兩種規(guī)格的GPU與CPU、NVLink 6交換芯片和ConnectX-9 SuperNIC。這款新服務(wù)器專為處理創(chuàng)建此類模擬而設(shè)計(jì),能應(yīng)對(duì)模型訓(xùn)練所需的海量計(jì)算負(fù)載。命名靈感來(lái)源于20世紀(jì)中期美國(guó)天文學(xué)家Vera Rubin,她通過(guò)對(duì)天體運(yùn)動(dòng)的開(kāi)創(chuàng)性觀測(cè)取得重大科學(xué)突破。
黃仁勛表示,每一顆芯片都是革命性的,都值得單獨(dú)開(kāi)一場(chǎng)發(fā)布會(huì)。從公開(kāi)數(shù)據(jù)來(lái)看,性能非常驚人:Rubin GPU的NVFP4推理算力為50PFLOPS,是Blackwell的5倍;NVFP4訓(xùn)練算力是35PFLOPS,是Blackwell的3.5倍;HBM4內(nèi)存帶寬22TB/s,是Blackwell的2.8倍,晶體管數(shù)量3360億個(gè),是Blackwell的1.6倍。通過(guò)軟硬件協(xié)同設(shè)計(jì),Rubin平臺(tái)將推理token成本降低10倍,將訓(xùn)練MoE模型所需的GPU數(shù)量減少4倍。
英偉達(dá)下一代AI超級(jí)芯片平臺(tái)Vera Rubin已進(jìn)入全面量產(chǎn),將于2026年下半年開(kāi)始向合作伙伴交付,AWS、Google Cloud、Microsoft、Oracle等主要云服務(wù)商已確認(rèn)部署。
有了充足的算力,軟件層才有想象空間。近年來(lái),Agentic AI成為熱門概念之一。英偉達(dá)試圖降低Agent的開(kāi)發(fā)成本,發(fā)布了Nemotron-CC,這是一個(gè)多語(yǔ)言預(yù)訓(xùn)練語(yǔ)料庫(kù),覆蓋140多種語(yǔ)言,總規(guī)模達(dá)1.4萬(wàn)億token。公司還強(qiáng)調(diào)了“Granary”指令數(shù)據(jù)集,目標(biāo)是讓模型在企業(yè)級(jí)任務(wù)上“開(kāi)箱即用”。利用英偉達(dá)的硬件和框架,開(kāi)發(fā)者在幾分鐘內(nèi)就能構(gòu)建出一個(gè)功能完整的個(gè)人助理。