黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2026-03-18 11:16:04 新浪財經(jīng)

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟。2026年3月17日凌晨，英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026開發(fā)者大會上發(fā)表了長達兩個半小時的主題演講。這場盛會不僅刷新了算力硬件的性能邊界，還重新定義了未來3-5年AI基礎設施的技術路線。

黃仁勛在演講中預測，到2027年，英偉達旗艦算力芯片將帶來1萬億美元的營收。這一數(shù)字相當于全球IT基礎設施預算的一次大換血，標志著AI行業(yè)正式從“野蠻生長”進入“工業(yè)化、基建化”新階段。

黃仁勛表示，英偉達不再是單一的芯片公司，而是致力于成為AI基礎設施的建造者。他提出了一套完整的AI堆棧，涵蓋從底層算力到上層應用、從數(shù)據(jù)處理到智能代理的全棧能力。過去二十年，英偉達用CUDA搭建了加速計算的基石；現(xiàn)在，公司正推動AI從技術探索走向產(chǎn)業(yè)落地，讓每個行業(yè)和企業(yè)都能享受到AI帶來的變革力量。

黃仁勛提出了AI的五層架構：能源→芯片→基礎設施→模型→應用。這個框架揭示了英偉達構建整個AI基礎設施生態(tài)系統(tǒng)的戰(zhàn)略。他還介紹了Vera Rubin平臺和LPU推理芯片等新技術。Vera Rubin平臺采用3nm工藝+HBM4內存，單GPU顯存帶寬達1.2TB/s，配合NVLink 6.0，單卡雙向帶寬達3.6TB/s。相比上代Blackwell平臺，Rubin Ultra機柜的推理吞吐量/瓦特提升高達10倍，推理Token成本降至原來的十分之一。

英偉達發(fā)布的LPU（Language Processing Unit）推理專用芯片整合了Groq技術，單芯片擁有230MB片上SRAM，內存帶寬高達80TB/s。通過數(shù)據(jù)近核處理，從根源降低推理延遲。當LPX平臺與Vera Rubin平臺結合時，整體推理吞吐量/功耗比可提升35倍。

黃仁勛還介紹了Feynman架構，該架構采用臺積電A16（1.6nm）制程，是全球首款邁入1.6納米時代的量產(chǎn)級AI芯片架構。Feynman架構面向萬億參數(shù)世界模型、具身智能與超大規(guī)模推理，實現(xiàn)了三大突破：制程革命、光互連原生集成硅光子引擎片上集成、LPU混合堆疊與推理專用LPU 3D鍵合。

黃仁勛提出了一個全新的商業(yè)概念——Token工廠：未來，數(shù)據(jù)中心將不再是簡單的“存儲中心”，而是生產(chǎn)“智能Token”的工廠。Token是AI的核心生產(chǎn)資料，是AI理解世界、處理信息的基本單位。英偉達的目標是讓全球數(shù)據(jù)中心都能成為高效、低成本的Token生產(chǎn)基地。通過極致的協(xié)同設計，英偉達已經(jīng)將單位Token成本降到了全球領先的水平。

為了展示這1萬億美元需求的合理性，黃仁勛向全球企業(yè)CEO展示了一套新的商業(yè)思維，將未來的AI服務分為五個商業(yè)層級：Free層、Medium層、High層、Premium層和Ultra層。黃仁勛指出，AI越“聰明”，價格越高，但吞吐量反而越低，因此架構優(yōu)化至關重要。

黃仁勛還介紹了NemoClaw和OpenClaw兩個軟件生態(tài)項目。NemoClaw是一個開源平臺，本質上是集成了企業(yè)級安全和隱私考慮的OpenClaw。黃仁勛表示，每家公司都需要有一個OpenClaw策略。OpenClaw被形容為“人類歷史上最受歡迎的開源項目”，僅用幾周時間就超越了Linux在過去30年的成就。

黃仁勛認為物理AI已經(jīng)到來，每家工業(yè)公司都將變成機器人公司。展會現(xiàn)場展出了110款實體機器人，覆蓋出行、工業(yè)、醫(yī)療、科研與消費等全場景應用。英偉達發(fā)布了Cosmos 3世界模型，并宣布與比亞迪、吉利、日產(chǎn)等頭部車企合作，基于DRIVE Hyperion平臺打造L4級自動駕駛汽車。此外，英偉達還與Uber擴大合作，計劃到2028年，在橫跨四大洲的28個城市推出完全由NVIDIA DRIVE AV軟件驅動的自動駕駛車隊。

對于國內AI發(fā)展，黃仁勛明確宣告AI產(chǎn)業(yè)已全面轉向推理時代。國內AI企業(yè)需要重新審視戰(zhàn)略定位，從“模型競賽”轉向“推理應用實戰(zhàn)”。不同于訓練端的一次性高投入，推理是全場景持續(xù)剛需，現(xiàn)金流穩(wěn)定。這為國內AI企業(yè)提供了更可持續(xù)的商業(yè)化路徑。國內企業(yè)需要從單純追求算力規(guī)模，轉向極致優(yōu)化推理效率和Token成本。

英偉達在高端芯片、全棧生態(tài)上的優(yōu)勢短期內難以全面追趕，國內廠商在低時延推理、私有化部署、國產(chǎn)化適配、垂直場景算子優(yōu)化等方面具備工程化優(yōu)勢與本土市場空間。國內昆侖芯3代、寒武紀思元370等推理芯片，均采用“大SRAM+近存計算”的架構設計，頂尖產(chǎn)品片上SRAM最高達144MB，70B模型首Token延遲可控制在0.15秒左右。這些芯片已在中低端推理場景實現(xiàn)規(guī)模化商用部署，但核心能效比與LPU仍存在差距。

黃仁勛強調所有SaaS公司都將消失，他認為“AaaS（智能體即服務）”將成為企業(yè)核心交付形式。國內阿里通義Agent、華為盤古Agent等框架已支持100+原生工具調用，企業(yè)場景落地準確率≥95%，輕量化模型推理速度提升5倍。國內在機器人、自動駕駛、工業(yè)數(shù)字孿生等領域具備完整的產(chǎn)業(yè)鏈基礎。國內華為、光迅科技等廠商已完成CPO共封裝光學樣品研發(fā)，單端口速率達1.6Tbps，較傳統(tǒng)電互聯(lián)功耗降低60%。

GTC 2026標志著英偉達完成了從“賣鏟子”到“建工廠”的范式轉移。Vera Rubin的亮相與1萬億美元訂單的確認，證明了AI浪潮遠未見頂。2026年Q3-Q4，Rubin Ultra將大規(guī)模交付，產(chǎn)業(yè)鏈訂單集中兌現(xiàn)；2027年，F(xiàn)eynman架構進入試產(chǎn)階段，LPU推理芯片在實時AI場景大規(guī)模部署；2028年，F(xiàn)eynman架構正式量產(chǎn)，1.6nm制程帶動半導體設備、材料新一輪升級。

在這個拐點時刻，無論是用戶、企業(yè)、開發(fā)者還是投資者，都需要思考如何在AI工業(yè)化時代找到自己的位置。對國內AI產(chǎn)業(yè)而言，短期內追趕先進制程困難重重，但成熟制程基本盤、封測優(yōu)勢及龐大本土應用市場構成差異化發(fā)展基礎。誰能將推理成本降下來、算力效率提上去，誰就能掌控話語權。

(責任編輯：0882)

關閉

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟

相關新聞

今日熱點

頻道熱點