黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2026-03-18 11:16:04 新浪財經(jīng)

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟。2026年3月17日凌晨，英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026開發(fā)者大會上發(fā)表了長達兩個半小時的主題演講。這場盛會不僅刷新了算力硬件的性能邊界，還重新定義了未來3-5年AI基礎設施的技術路線。

黃仁勛在演講中預測，到2027年，英偉達旗艦算力芯片將帶來1萬億美元的營收。這一數(shù)字相當于全球IT基礎設施預算的一次大換血，標志著AI行業(yè)正式從“野蠻生長”進入“工業(yè)化、基建化”新階段。

黃仁勛表示，英偉達不再是單一的芯片公司，而是致力于成為AI基礎設施的建造者。他提出了一套完整的AI堆棧，涵蓋從底層算力到上層應用、從數(shù)據(jù)處理到智能代理的全棧能力。過去二十年，英偉達用CUDA搭建了加速計算的基石；現(xiàn)在，公司正推動AI從技術探索走向產(chǎn)業(yè)落地，讓每個行業(yè)和企業(yè)都能享受到AI帶來的變革力量。

黃仁勛提出了AI的五層架構：能源→芯片→基礎設施→模型→應用。這個框架揭示了英偉達構建整個AI基礎設施生態(tài)系統(tǒng)的戰(zhàn)略。他還介紹了Vera Rubin平臺和LPU推理芯片等新技術。Vera Rubin平臺采用3nm工藝+HBM4內存，單GPU顯存帶寬達1.2TB/s，配合NVLink 6.0，單卡雙向帶寬達3.6TB/s。相比上代Blackwell平臺，Rubin Ultra機柜的推理吞吐量/瓦特提升高達10倍，推理Token成本降至原來的十分之一。

英偉達發(fā)布的LPU（Language Processing Unit）推理專用芯片整合了Groq技術，單芯片擁有230MB片上SRAM，內存帶寬高達80TB/s。通過數(shù)據(jù)近核處理，從根源降低推理延遲。當LPX平臺與Vera Rubin平臺結合時，整體推理吞吐量/功耗比可提升35倍。

黃仁勛還介紹了Feynman架構，該架構采用臺積電A16（1.6nm）制程，是全球首款邁入1.6納米時代的量產(chǎn)級AI芯片架構。Feynman架構面向萬億參數(shù)世界模型、具身智能與超大規(guī)模推理，實現(xiàn)了三大突破：制程革命、光互連原生集成硅光子引擎片上集成、LPU混合堆疊與推理專用LPU 3D鍵合。

12 3 全文共 3 頁下一頁

關閉

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟

相關新聞

今日熱點

頻道熱點