黃仁勛重新定義數(shù)字員工和物理AI 開(kāi)啟智能新時(shí)代

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-01-07 15:16:27 鈦媒體APP

黃仁勛重新定義數(shù)字員工和物理AI！美國(guó)當(dāng)?shù)貢r(shí)間1月5日，英偉達(dá)CEO黃仁勛在拉斯維加斯楓丹白露酒店的劇場(chǎng)中心進(jìn)行了新年的首場(chǎng)演講。他依舊穿著那身標(biāo)志性的皮衣。

通常情況下，英偉達(dá)會(huì)在春季于硅谷舉行的開(kāi)發(fā)者大會(huì)上詳細(xì)介紹其最新芯片的規(guī)格和性能。然而，由于人工智能所需的計(jì)算復(fù)雜度不斷提高，以及市場(chǎng)對(duì)先進(jìn)處理器用于訓(xùn)練和運(yùn)行AI模型的巨大需求，整個(gè)半導(dǎo)體行業(yè)不得不加快步伐。

在總結(jié)2025年的變化時(shí)，黃仁勛特別提到了DeepSeek R1的出現(xiàn)所起到的催化劑作用，并展示了中國(guó)開(kāi)源模型Kimi K2和Qwen。這場(chǎng)持續(xù)一個(gè)半小時(shí)的演講信息量極大，涵蓋了Agentic AI、物理AI和新芯片三大關(guān)鍵詞。

此次大會(huì)上，英偉達(dá)發(fā)布了一套由六個(gè)部分組成的Rubin平臺(tái)，包括兩種規(guī)格的GPU與CPU、NVLink 6交換芯片和ConnectX-9 SuperNIC。這款新服務(wù)器專為處理創(chuàng)建此類模擬而設(shè)計(jì)，能應(yīng)對(duì)模型訓(xùn)練所需的海量計(jì)算負(fù)載。命名靈感來(lái)源于20世紀(jì)中期美國(guó)天文學(xué)家Vera Rubin，她通過(guò)對(duì)天體運(yùn)動(dòng)的開(kāi)創(chuàng)性觀測(cè)取得重大科學(xué)突破。

黃仁勛表示，每一顆芯片都是革命性的，都值得單獨(dú)開(kāi)一場(chǎng)發(fā)布會(huì)。從公開(kāi)數(shù)據(jù)來(lái)看，性能非常驚人：Rubin GPU的NVFP4推理算力為50PFLOPS，是Blackwell的5倍；NVFP4訓(xùn)練算力是35PFLOPS，是Blackwell的3.5倍；HBM4內(nèi)存帶寬22TB/s，是Blackwell的2.8倍，晶體管數(shù)量3360億個(gè)，是Blackwell的1.6倍。通過(guò)軟硬件協(xié)同設(shè)計(jì)，Rubin平臺(tái)將推理token成本降低10倍，將訓(xùn)練MoE模型所需的GPU數(shù)量減少4倍。

英偉達(dá)下一代AI超級(jí)芯片平臺(tái)Vera Rubin已進(jìn)入全面量產(chǎn)，將于2026年下半年開(kāi)始向合作伙伴交付，AWS、Google Cloud、Microsoft、Oracle等主要云服務(wù)商已確認(rèn)部署。

有了充足的算力，軟件層才有想象空間。近年來(lái)，Agentic AI成為熱門概念之一。英偉達(dá)試圖降低Agent的開(kāi)發(fā)成本，發(fā)布了Nemotron-CC，這是一個(gè)多語(yǔ)言預(yù)訓(xùn)練語(yǔ)料庫(kù)，覆蓋140多種語(yǔ)言，總規(guī)模達(dá)1.4萬(wàn)億token。公司還強(qiáng)調(diào)了“Granary”指令數(shù)據(jù)集，目標(biāo)是讓模型在企業(yè)級(jí)任務(wù)上“開(kāi)箱即用”。利用英偉達(dá)的硬件和框架，開(kāi)發(fā)者在幾分鐘內(nèi)就能構(gòu)建出一個(gè)功能完整的個(gè)人助理。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

黃仁勛重新定義數(shù)字員工和物理AI 開(kāi)啟智能新時(shí)代

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)