黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟。2026年3月17日凌晨,英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026開發(fā)者大會上發(fā)表了長達兩個半小時的主題演講。這場盛會不僅刷新了算力硬件的性能邊界,還重新定義了未來3-5年AI基礎設施的技術路線。
黃仁勛在演講中預測,到2027年,英偉達旗艦算力芯片將帶來1萬億美元的營收。這一數(shù)字相當于全球IT基礎設施預算的一次大換血,標志著AI行業(yè)正式從“野蠻生長”進入“工業(yè)化、基建化”新階段。
黃仁勛表示,英偉達不再是單一的芯片公司,而是致力于成為AI基礎設施的建造者。他提出了一套完整的AI堆棧,涵蓋從底層算力到上層應用、從數(shù)據(jù)處理到智能代理的全棧能力。過去二十年,英偉達用CUDA搭建了加速計算的基石;現(xiàn)在,公司正推動AI從技術探索走向產(chǎn)業(yè)落地,讓每個行業(yè)和企業(yè)都能享受到AI帶來的變革力量。
黃仁勛提出了AI的五層架構:能源→芯片→基礎設施→模型→應用。這個框架揭示了英偉達構建整個AI基礎設施生態(tài)系統(tǒng)的戰(zhàn)略。他還介紹了Vera Rubin平臺和LPU推理芯片等新技術。Vera Rubin平臺采用3nm工藝+HBM4內存,單GPU顯存帶寬達1.2TB/s,配合NVLink 6.0,單卡雙向帶寬達3.6TB/s。相比上代Blackwell平臺,Rubin Ultra機柜的推理吞吐量/瓦特提升高達10倍,推理Token成本降至原來的十分之一。
英偉達發(fā)布的LPU(Language Processing Unit)推理專用芯片整合了Groq技術,單芯片擁有230MB片上SRAM,內存帶寬高達80TB/s。通過數(shù)據(jù)近核處理,從根源降低推理延遲。當LPX平臺與Vera Rubin平臺結合時,整體推理吞吐量/功耗比可提升35倍。
黃仁勛還介紹了Feynman架構,該架構采用臺積電A16(1.6nm)制程,是全球首款邁入1.6納米時代的量產(chǎn)級AI芯片架構。Feynman架構面向萬億參數(shù)世界模型、具身智能與超大規(guī)模推理,實現(xiàn)了三大突破:制程革命、光互連原生集成硅光子引擎片上集成、LPU混合堆疊與推理專用LPU 3D鍵合。
黃仁勛提出了一個全新的商業(yè)概念——Token工廠:未來,數(shù)據(jù)中心將不再是簡單的“存儲中心”,而是生產(chǎn)“智能Token”的工廠。Token是AI的核心生產(chǎn)資料,是AI理解世界、處理信息的基本單位。英偉達的目標是讓全球數(shù)據(jù)中心都能成為高效、低成本的Token生產(chǎn)基地。通過極致的協(xié)同設計,英偉達已經(jīng)將單位Token成本降到了全球領先的水平。
為了展示這1萬億美元需求的合理性,黃仁勛向全球企業(yè)CEO展示了一套新的商業(yè)思維,將未來的AI服務分為五個商業(yè)層級:Free層、Medium層、High層、Premium層和Ultra層。黃仁勛指出,AI越“聰明”,價格越高,但吞吐量反而越低,因此架構優(yōu)化至關重要。
黃仁勛還介紹了NemoClaw和OpenClaw兩個軟件生態(tài)項目。NemoClaw是一個開源平臺,本質上是集成了企業(yè)級安全和隱私考慮的OpenClaw。黃仁勛表示,每家公司都需要有一個OpenClaw策略。OpenClaw被形容為“人類歷史上最受歡迎的開源項目”,僅用幾周時間就超越了Linux在過去30年的成就。
黃仁勛認為物理AI已經(jīng)到來,每家工業(yè)公司都將變成機器人公司。展會現(xiàn)場展出了110款實體機器人,覆蓋出行、工業(yè)、醫(yī)療、科研與消費等全場景應用。英偉達發(fā)布了Cosmos 3世界模型,并宣布與比亞迪、吉利、日產(chǎn)等頭部車企合作,基于DRIVE Hyperion平臺打造L4級自動駕駛汽車。此外,英偉達還與Uber擴大合作,計劃到2028年,在橫跨四大洲的28個城市推出完全由NVIDIA DRIVE AV軟件驅動的自動駕駛車隊。
對于國內AI發(fā)展,黃仁勛明確宣告AI產(chǎn)業(yè)已全面轉向推理時代。國內AI企業(yè)需要重新審視戰(zhàn)略定位,從“模型競賽”轉向“推理應用實戰(zhàn)”。不同于訓練端的一次性高投入,推理是全場景持續(xù)剛需,現(xiàn)金流穩(wěn)定。這為國內AI企業(yè)提供了更可持續(xù)的商業(yè)化路徑。國內企業(yè)需要從單純追求算力規(guī)模,轉向極致優(yōu)化推理效率和Token成本。
英偉達在高端芯片、全棧生態(tài)上的優(yōu)勢短期內難以全面追趕,國內廠商在低時延推理、私有化部署、國產(chǎn)化適配、垂直場景算子優(yōu)化等方面具備工程化優(yōu)勢與本土市場空間。國內昆侖芯3代、寒武紀思元370等推理芯片,均采用“大SRAM+近存計算”的架構設計,頂尖產(chǎn)品片上SRAM最高達144MB,70B模型首Token延遲可控制在0.15秒左右。這些芯片已在中低端推理場景實現(xiàn)規(guī)模化商用部署,但核心能效比與LPU仍存在差距。
黃仁勛強調所有SaaS公司都將消失,他認為“AaaS(智能體即服務)”將成為企業(yè)核心交付形式。國內阿里通義Agent、華為盤古Agent等框架已支持100+原生工具調用,企業(yè)場景落地準確率≥95%,輕量化模型推理速度提升5倍。國內在機器人、自動駕駛、工業(yè)數(shù)字孿生等領域具備完整的產(chǎn)業(yè)鏈基礎。國內華為、光迅科技等廠商已完成CPO共封裝光學樣品研發(fā),單端口速率達1.6Tbps,較傳統(tǒng)電互聯(lián)功耗降低60%。
GTC 2026標志著英偉達完成了從“賣鏟子”到“建工廠”的范式轉移。Vera Rubin的亮相與1萬億美元訂單的確認,證明了AI浪潮遠未見頂。2026年Q3-Q4,Rubin Ultra將大規(guī)模交付,產(chǎn)業(yè)鏈訂單集中兌現(xiàn);2027年,F(xiàn)eynman架構進入試產(chǎn)階段,LPU推理芯片在實時AI場景大規(guī)模部署;2028年,F(xiàn)eynman架構正式量產(chǎn),1.6nm制程帶動半導體設備、材料新一輪升級。
在這個拐點時刻,無論是用戶、企業(yè)、開發(fā)者還是投資者,都需要思考如何在AI工業(yè)化時代找到自己的位置。對國內AI產(chǎn)業(yè)而言,短期內追趕先進制程困難重重,但成熟制程基本盤、封測優(yōu)勢及龐大本土應用市場構成差異化發(fā)展基礎。誰能將推理成本降下來、算力效率提上去,誰就能掌控話語權。
近日,英偉達CEO黃仁勛在一檔科技博客節(jié)目中進行了長達150分鐘的深度訪談。他罕見地談及對死亡的看法,表示希望未來能在工作中突然離世
2026-03-25 15:25:57黃仁勛談死亡近日,英偉達CEO黃仁勛在一檔科技博客節(jié)目中接受了長達150分鐘的深度訪談。在訪談中,他罕見地談及了對死亡的看法,表示希望未來能在工作中突然離世
2026-03-26 01:15:19英偉達CEO黃仁勛播客談死亡