电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟

關鍵詞:
2026-03-18 11:16:04  新浪財經(jīng)

黃仁勛宣告SaaS“死亡” AI基礎設施新時代開啟。2026年3月17日凌晨,英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026開發(fā)者大會上發(fā)表了長達兩個半小時的主題演講。這場盛會不僅刷新了算力硬件的性能邊界,還重新定義了未來3-5年AI基礎設施的技術路線。

黃仁勛在演講中預測,到2027年,英偉達旗艦算力芯片將帶來1萬億美元的營收。這一數(shù)字相當于全球IT基礎設施預算的一次大換血,標志著AI行業(yè)正式從“野蠻生長”進入“工業(yè)化、基建化”新階段。

黃仁勛表示,英偉達不再是單一的芯片公司,而是致力于成為AI基礎設施的建造者。他提出了一套完整的AI堆棧,涵蓋從底層算力到上層應用、從數(shù)據(jù)處理到智能代理的全棧能力。過去二十年,英偉達用CUDA搭建了加速計算的基石;現(xiàn)在,公司正推動AI從技術探索走向產(chǎn)業(yè)落地,讓每個行業(yè)和企業(yè)都能享受到AI帶來的變革力量。

黃仁勛提出了AI的五層架構:能源→芯片→基礎設施→模型→應用。這個框架揭示了英偉達構建整個AI基礎設施生態(tài)系統(tǒng)的戰(zhàn)略。他還介紹了Vera Rubin平臺和LPU推理芯片等新技術。Vera Rubin平臺采用3nm工藝+HBM4內存,單GPU顯存帶寬達1.2TB/s,配合NVLink 6.0,單卡雙向帶寬達3.6TB/s。相比上代Blackwell平臺,Rubin Ultra機柜的推理吞吐量/瓦特提升高達10倍,推理Token成本降至原來的十分之一。

英偉達發(fā)布的LPU(Language Processing Unit)推理專用芯片整合了Groq技術,單芯片擁有230MB片上SRAM,內存帶寬高達80TB/s。通過數(shù)據(jù)近核處理,從根源降低推理延遲。當LPX平臺與Vera Rubin平臺結合時,整體推理吞吐量/功耗比可提升35倍。

黃仁勛還介紹了Feynman架構,該架構采用臺積電A16(1.6nm)制程,是全球首款邁入1.6納米時代的量產(chǎn)級AI芯片架構。Feynman架構面向萬億參數(shù)世界模型、具身智能與超大規(guī)模推理,實現(xiàn)了三大突破:制程革命、光互連原生集成硅光子引擎片上集成、LPU混合堆疊與推理專用LPU 3D鍵合。

黃仁勛提出了一個全新的商業(yè)概念——Token工廠:未來,數(shù)據(jù)中心將不再是簡單的“存儲中心”,而是生產(chǎn)“智能Token”的工廠。Token是AI的核心生產(chǎn)資料,是AI理解世界、處理信息的基本單位。英偉達的目標是讓全球數(shù)據(jù)中心都能成為高效、低成本的Token生產(chǎn)基地。通過極致的協(xié)同設計,英偉達已經(jīng)將單位Token成本降到了全球領先的水平。

為了展示這1萬億美元需求的合理性,黃仁勛向全球企業(yè)CEO展示了一套新的商業(yè)思維,將未來的AI服務分為五個商業(yè)層級:Free層、Medium層、High層、Premium層和Ultra層。黃仁勛指出,AI越“聰明”,價格越高,但吞吐量反而越低,因此架構優(yōu)化至關重要。

黃仁勛還介紹了NemoClaw和OpenClaw兩個軟件生態(tài)項目。NemoClaw是一個開源平臺,本質上是集成了企業(yè)級安全和隱私考慮的OpenClaw。黃仁勛表示,每家公司都需要有一個OpenClaw策略。OpenClaw被形容為“人類歷史上最受歡迎的開源項目”,僅用幾周時間就超越了Linux在過去30年的成就。

黃仁勛認為物理AI已經(jīng)到來,每家工業(yè)公司都將變成機器人公司。展會現(xiàn)場展出了110款實體機器人,覆蓋出行、工業(yè)、醫(yī)療、科研與消費等全場景應用。英偉達發(fā)布了Cosmos 3世界模型,并宣布與比亞迪、吉利、日產(chǎn)等頭部車企合作,基于DRIVE Hyperion平臺打造L4級自動駕駛汽車。此外,英偉達還與Uber擴大合作,計劃到2028年,在橫跨四大洲的28個城市推出完全由NVIDIA DRIVE AV軟件驅動的自動駕駛車隊。

對于國內AI發(fā)展,黃仁勛明確宣告AI產(chǎn)業(yè)已全面轉向推理時代。國內AI企業(yè)需要重新審視戰(zhàn)略定位,從“模型競賽”轉向“推理應用實戰(zhàn)”。不同于訓練端的一次性高投入,推理是全場景持續(xù)剛需,現(xiàn)金流穩(wěn)定。這為國內AI企業(yè)提供了更可持續(xù)的商業(yè)化路徑。國內企業(yè)需要從單純追求算力規(guī)模,轉向極致優(yōu)化推理效率和Token成本。

英偉達在高端芯片、全棧生態(tài)上的優(yōu)勢短期內難以全面追趕,國內廠商在低時延推理、私有化部署、國產(chǎn)化適配、垂直場景算子優(yōu)化等方面具備工程化優(yōu)勢與本土市場空間。國內昆侖芯3代、寒武紀思元370等推理芯片,均采用“大SRAM+近存計算”的架構設計,頂尖產(chǎn)品片上SRAM最高達144MB,70B模型首Token延遲可控制在0.15秒左右。這些芯片已在中低端推理場景實現(xiàn)規(guī)模化商用部署,但核心能效比與LPU仍存在差距。

黃仁勛強調所有SaaS公司都將消失,他認為“AaaS(智能體即服務)”將成為企業(yè)核心交付形式。國內阿里通義Agent、華為盤古Agent等框架已支持100+原生工具調用,企業(yè)場景落地準確率≥95%,輕量化模型推理速度提升5倍。國內在機器人、自動駕駛、工業(yè)數(shù)字孿生等領域具備完整的產(chǎn)業(yè)鏈基礎。國內華為、光迅科技等廠商已完成CPO共封裝光學樣品研發(fā),單端口速率達1.6Tbps,較傳統(tǒng)電互聯(lián)功耗降低60%。

GTC 2026標志著英偉達完成了從“賣鏟子”到“建工廠”的范式轉移。Vera Rubin的亮相與1萬億美元訂單的確認,證明了AI浪潮遠未見頂。2026年Q3-Q4,Rubin Ultra將大規(guī)模交付,產(chǎn)業(yè)鏈訂單集中兌現(xiàn);2027年,F(xiàn)eynman架構進入試產(chǎn)階段,LPU推理芯片在實時AI場景大規(guī)模部署;2028年,F(xiàn)eynman架構正式量產(chǎn),1.6nm制程帶動半導體設備、材料新一輪升級。

在這個拐點時刻,無論是用戶、企業(yè)、開發(fā)者還是投資者,都需要思考如何在AI工業(yè)化時代找到自己的位置。對國內AI產(chǎn)業(yè)而言,短期內追趕先進制程困難重重,但成熟制程基本盤、封測優(yōu)勢及龐大本土應用市場構成差異化發(fā)展基礎。誰能將推理成本降下來、算力效率提上去,誰就能掌控話語權。

(責任編輯:0882)
關閉

高位科技股“情緒殺” 市場為何變臉 獲利盤出逃引發(fā)調整

高位科技股情緒殺市場為何變臉2026-04-24 22:43:37

黃金上漲的邏輯變了嗎 美聯(lián)儲政策影響幾何

黃金上漲的邏輯變了嗎2026-04-24 22:38:07

媽 我在隧道救人我可能出不去了:生死關頭的勇敢抉擇

媽我在隧道救人我可能出不去了2026-04-24 22:35:09

中國海軍或將迎核航母 核動力時代來臨

中國海軍或將迎核航母2026-04-24 15:29:15

鐵路12306將發(fā)放三檔滿減券 旅游惠民新舉措

鐵路12306將發(fā)放三檔滿減券2026-04-24 22:32:13

日本呼吁震區(qū)民眾做好防災準備 海嘯警報發(fā)布

日本呼吁震區(qū)民眾做好防災準備2026-04-24 15:59:26

媽 我在隧道救人我可能出不去了:生死關頭的勇敢抉擇

媽我在隧道救人我可能出不去了2026-04-24 22:35:09

當?shù)赝▓蟆?旬老人遭8旬老人毆打” 養(yǎng)老院管理引質疑

當?shù)赝▓?旬老人遭8旬老人毆打2026-04-24 22:29:40

中國第四艘航母真會是核動力的嗎 官方宣傳片暗藏玄機

中國第四艘航母真會是核動力的嗎2026-04-24 16:56:18

黃金上漲的邏輯變了嗎 美聯(lián)儲政策影響幾何

黃金上漲的邏輯變了嗎2026-04-24 22:38:07

甲骨文全球裁員30000人背后,是AI泡沫還是AI替代? AI轉型代價

甲骨文全球裁員30000人背后,是AI泡沫還是AI替代2026-04-24 22:21:58

日本軍事動作頻頻 加速再軍事化引發(fā)警惕

日本軍事動作頻頻2026-04-24 15:28:42

尚界Z7和小米SU7怎么選 智能配置對決

尚界Z7和小米SU7怎么選2026-04-24 22:27:34

美國巴士爆炸 濃煙沖上高空 華盛頓市中心陷入恐慌

美國巴士爆炸濃煙沖上高空2026-04-24 15:25:58

女子從128斤減至85斤“撞臉”楊冪 健康蛻變引熱議

女子從128斤減至85斤撞臉楊冪2026-04-24 22:27:03

東高村鎮(zhèn)西紅柿嘗鮮季啟幕 春日雙鮮果樂

東高村鎮(zhèn)西紅柿嘗鮮季啟幕2026-04-24 22:16:19

投票彈劾賴清德日期定了 朝野協(xié)商定案

投票彈劾賴清德日期定了2026-04-24 16:55:52

攻擊-21登上福建艦了嗎 隱身無人機引發(fā)關注

攻擊-21登上福建艦了嗎2026-04-24 15:25:24

英國“終身禁煙令”引熱議 打造無煙一代

英國終身禁煙令引熱議2026-04-24 15:00:03

特朗普稱不知道伊朗真正領導人是誰 內斗加劇引發(fā)關注

特朗普稱不知道伊朗真正領導人是誰2026-04-24 15:27:38

評論員:日本沉溺帝國舊夢131年 臺海挑釁引發(fā)解放軍強勢回應

評論員,日本沉溺帝國舊夢131年2026-04-24 17:00:04

因滑坡中斷國道或五一前通車 搶修進行中爭取恢復通行

因滑坡中斷國道或五一前通車2026-04-24 22:05:18

抗美援朝老兵走進軍營講戰(zhàn)斗故事 傳承先烈精神

抗美援朝老兵走進軍營講戰(zhàn)斗故事2026-04-24 22:30:40

日本推進航空自衛(wèi)隊更名航空宇宙自衛(wèi)隊 修正案通過表決

日本推進航空自衛(wèi)隊更名航空宇宙自衛(wèi)隊2026-04-24 16:44:35

美大炮巨艦與伊朗蜂群突擊誰主沉浮 海上拉鋸持續(xù)對峙

美大炮巨艦與伊朗蜂群突擊誰主沉浮2026-04-24 20:46:59

高位科技股“情緒殺” 市場為何變臉 獲利盤出逃引發(fā)調整

高位科技股情緒殺市場為何變臉2026-04-24 22:43:37

黎巴嫩民眾為遇難女記者送行 哀悼與敬意交織

黎巴嫩民眾為遇難女記者送行2026-04-24 16:53:49

女摩托車主遭3男子騷擾摸腰崩潰大哭 警方已依法拘留涉事者

女摩托車主遭3男子騷擾摸腰崩潰大哭2026-04-24 22:19:00

比亞迪全新概念車OCEAN-V首發(fā)亮相 多功能設計引領未來出行

比亞迪全新概念車OCEAN-V首發(fā)亮相2026-04-24 22:10:25

一輛公交車上的雙向生命守護 公交司機強忍痛苦停車救了一車人

公交司機強忍痛苦停車救了一車人2026-04-24 22:15:49

2歲萌娃喊話林丹一起打球林丹真來了 夢想成真共赴球約

2歲萌娃喊話林丹一起打球林丹真來了2026-04-24 22:07:53

特斯拉確認Cybercab已正式投產(chǎn)!北美工廠啟動生產(chǎn)

特斯拉確認Cybercab已正式投產(chǎn)2026-04-24 15:56:50

他為中國龍插上了翅膀

他為中國龍插上了翅膀2026-04-24 22:21:25

北京車展上現(xiàn)“汽車跳舞” 李想親自熱舞助陣

北京車展上現(xiàn)汽車跳舞2026-04-24 22:32:43

相關新聞