非GPU算力路線開始反攻英偉達 AI推理市場迎來變革。英偉達的“GPU帝國”在AI發(fā)展的前十年憑借其在人工智能訓練領域的優(yōu)勢穩(wěn)坐王者寶座。然而,隨著行業(yè)主戰(zhàn)場從模型訓練轉向模型推理,算力的焦點不再是硬件性能,而是誰能以更優(yōu)的經濟模型支撐海量推理需求。英偉達不再是唯一的規(guī)則制定者,而成為眾多玩家中的一員。
過去的算力競賽主要是英偉達不斷提升GPU性能的過程。從H100到Blackwell,再到Vera Rubin,每一次迭代都逼近物理極限。但當AI從集中訓練走向分散推理時,算力使用邏輯發(fā)生了根本變化。推理階段比訓練更頻繁、更分散,也更注重能耗與成本。為訓練設計的GPU在這一點上顯露出天生短板。
GPU以高吞吐率著稱,但推理任務往往是串行和實時的。例如ChatGPT每生成一個詞,都是一次獨立計算。這就像在萬人體育場中只允許一個人通行,資源浪費極大。算力閑置帶來的能耗與成本,成為AI公司難以承受的“推理稅”。
新的硬件革命迅速展開,多種非GPU架構陸續(xù)登場,目標一致——降低推理能耗,提升單位經濟性。谷歌的TPU早在2016年就已面世,通過“脈動陣列”架構,讓數(shù)據(jù)在芯片內部高效流動,減少訪存延遲,比GPU更符合推理需求。同樣任務下,TPU的性價比可達英偉達H100的四倍以上,能耗亦能降低約六成。如今,谷歌已將TPU推向公有云,Meta、Anthropic等大客戶紛紛采購,傳統(tǒng)GPU市場的格局被撼動。
Cerebras則以徹底顛覆的方式出圈。它的晶圓級芯片WSE不再切割成數(shù)百個小芯片,而是完整保留整片晶圓,形成一個巨型“單芯片計算機”。這種設計使得大模型的訓練和推理都能在單芯片內進行,極大降低通信延遲。WSE-3的能效比GPU集群高出十倍以上,成為OpenAI、Cerebras云服務的核心引擎。
另一家明星企業(yè)Groq代表了極端低延遲的方向。其核心產品LPU徹底消除了傳統(tǒng)GPU的“動態(tài)調度”延遲,所有計算路徑在編譯階段就被預先規(guī)劃,可實現(xiàn)每秒數(shù)百個Tokens的推理速度,專為實時AI交互場景設計。
目前,TPU、Cerebras、Groq,再加上AWS的Trainium和微軟的Maia,共同構成了崛起的非GPU陣營。AI算力的競爭格局正在從單極走向多元。面對這一局面,英偉達并未退縮。今年,它以200億美元獲得了Groq的非排他性技術許可。這筆交易本質上是一次“智囊招募”,目的在于將LPU的低延遲優(yōu)勢納入英偉達生態(tài),推動下一代異構架構的融合。未來,英偉達有望推出同時兼具訓練與推理功能的復合芯片,以適應日益多樣化的市場需求。
AI公司的策略也在變化。OpenAI、Meta、Anthropic都在實踐“多架構混合策略”:訓練階段仍依賴CUDA生態(tài)完善的GPU,而推理階段則更多使用TPU、Trainium或Cerebras,以降低成本。這種靈活組合不僅提高了資源利用率,也極大增強了企業(yè)的議價能力。
從商業(yè)模式上看,算力的售賣正在從硬件供給轉向“算力即服務”。谷歌、AWS和Cerebras都以調用次數(shù)或每百萬Tokens成本計費??蛻絷P注的不再是使用哪種芯片,而是誰能提供更可預測、更具性價比的AI算力生產力。
未來的AI基礎設施將形成“異構共生”的格局。GPU仍將在科研和模型訓練領域保持優(yōu)勢,而TPU、LPU、WSE等專設架構將成為AI推理的中堅力量。競爭帶來的最大紅利是推理成本的下降與創(chuàng)新門檻的降低。AI不再只是巨頭的游戲,而會成為更多創(chuàng)業(yè)者可負擔的技術底座。
英偉達仍是算力世界的重要玩家,但它必須學會在更復雜的生態(tài)中共生。未來的競爭不再是硬件堆疊的較量,而是經濟效率、生態(tài)整合與開放創(chuàng)新的較量。在這場從訓練到推理的時代轉變中,AI的計算模式正邁入一個更加開放而多元的階段。對于英偉達,這既是挑戰(zhàn),也是機會;對于整個AI產業(yè)而言,這或許是一次重塑未來的真正起點。
ChatGPT漲價的討論再次成為熱點。Plus版從20美元漲到22美元,美區(qū)Team版從25美元漲到30美元,Claude在原有的20美元Pro版之外,新增了30美元的Team檔和Max檔
2025-12-01 17:31:04英偉達的瘋狂賬本昨天凌晨,我看著黃金盤的下跌心情沉重。這時,電腦瀏覽器推送了一條新聞,標題稱世界上最有價值的公司Nvidia遇到了新的美國對手。起初并未在意,以為是哪家芯片廠蹭熱點。但當我看到高通的名字時愣住了
2025-10-29 11:07:15高通芯片殺進英偉達腹地OpenAI 與超威半導體(AMD)達成協(xié)議,根據(jù)協(xié)議,OpenAI 或可收購這家芯片制造商 10% 的股份。消息公布后,AMD 股價在周一暴漲 23.71%
2025-10-07 09:18:47OpenAI背刺英偉達入股AMD