黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟。2026年3月17日凌晨,英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026開發(fā)者大會上發(fā)表了長達兩個半小時的主題演講。這場盛會不僅刷新了算力硬件的性能邊界,還重新定義了未來3-5年AI基礎設施的技術路線。
黃仁勛在演講中預測,到2027年,英偉達旗艦算力芯片將帶來1萬億美元的營收。這一數(shù)字相當于全球IT基礎設施預算的一次大換血,標志著AI行業(yè)正式從“野蠻生長”進入“工業(yè)化、基建化”新階段。
黃仁勛表示,英偉達不再是單一的芯片公司,而是致力于成為AI基礎設施的建造者。他提出了一套完整的AI堆棧,涵蓋從底層算力到上層應用、從數(shù)據(jù)處理到智能代理的全棧能力。過去二十年,英偉達用CUDA搭建了加速計算的基石;現(xiàn)在,公司正推動AI從技術探索走向產(chǎn)業(yè)落地,讓每個行業(yè)和企業(yè)都能享受到AI帶來的變革力量。
黃仁勛提出了AI的五層架構:能源→芯片→基礎設施→模型→應用。這個框架揭示了英偉達構建整個AI基礎設施生態(tài)系統(tǒng)的戰(zhàn)略。他還介紹了Vera Rubin平臺和LPU推理芯片等新技術。Vera Rubin平臺采用3nm工藝+HBM4內存,單GPU顯存帶寬達1.2TB/s,配合NVLink 6.0,單卡雙向帶寬達3.6TB/s。相比上代Blackwell平臺,Rubin Ultra機柜的推理吞吐量/瓦特提升高達10倍,推理Token成本降至原來的十分之一。
英偉達發(fā)布的LPU(Language Processing Unit)推理專用芯片整合了Groq技術,單芯片擁有230MB片上SRAM,內存帶寬高達80TB/s。通過數(shù)據(jù)近核處理,從根源降低推理延遲。當LPX平臺與Vera Rubin平臺結合時,整體推理吞吐量/功耗比可提升35倍。
黃仁勛還介紹了Feynman架構,該架構采用臺積電A16(1.6nm)制程,是全球首款邁入1.6納米時代的量產(chǎn)級AI芯片架構。Feynman架構面向萬億參數(shù)世界模型、具身智能與超大規(guī)模推理,實現(xiàn)了三大突破:制程革命、光互連原生集成硅光子引擎片上集成、LPU混合堆疊與推理專用LPU 3D鍵合。
近日,英偉達CEO黃仁勛在一檔科技博客節(jié)目中進行了長達150分鐘的深度訪談。他罕見地談及對死亡的看法,表示希望未來能在工作中突然離世
2026-03-25 15:25:57黃仁勛談死亡近日,英偉達CEO黃仁勛在一檔科技博客節(jié)目中接受了長達150分鐘的深度訪談。在訪談中,他罕見地談及了對死亡的看法,表示希望未來能在工作中突然離世
2026-03-26 01:15:19英偉達CEO黃仁勛播客談死亡