非GPU算力路線開始反攻英偉達 AI推理市場迎來變革。英偉達的“GPU帝國”在AI發(fā)展的前十年憑借其在人工智能訓練領域的優(yōu)勢穩(wěn)坐王者寶座。然而,隨著行業(yè)主戰(zhàn)場從模型訓練轉向模型推理,算力的焦點不再是硬件性能,而是誰能以更優(yōu)的經濟模型支撐海量推理需求。英偉達不再是唯一的規(guī)則制定者,而成為眾多玩家中的一員。
過去的算力競賽主要是英偉達不斷提升GPU性能的過程。從H100到Blackwell,再到Vera Rubin,每一次迭代都逼近物理極限。但當AI從集中訓練走向分散推理時,算力使用邏輯發(fā)生了根本變化。推理階段比訓練更頻繁、更分散,也更注重能耗與成本。為訓練設計的GPU在這一點上顯露出天生短板。
GPU以高吞吐率著稱,但推理任務往往是串行和實時的。例如ChatGPT每生成一個詞,都是一次獨立計算。這就像在萬人體育場中只允許一個人通行,資源浪費極大。算力閑置帶來的能耗與成本,成為AI公司難以承受的“推理稅”。
新的硬件革命迅速展開,多種非GPU架構陸續(xù)登場,目標一致——降低推理能耗,提升單位經濟性。谷歌的TPU早在2016年就已面世,通過“脈動陣列”架構,讓數據在芯片內部高效流動,減少訪存延遲,比GPU更符合推理需求。同樣任務下,TPU的性價比可達英偉達H100的四倍以上,能耗亦能降低約六成。如今,谷歌已將TPU推向公有云,Meta、Anthropic等大客戶紛紛采購,傳統GPU市場的格局被撼動。
Cerebras則以徹底顛覆的方式出圈。它的晶圓級芯片WSE不再切割成數百個小芯片,而是完整保留整片晶圓,形成一個巨型“單芯片計算機”。這種設計使得大模型的訓練和推理都能在單芯片內進行,極大降低通信延遲。WSE-3的能效比GPU集群高出十倍以上,成為OpenAI、Cerebras云服務的核心引擎。
ChatGPT漲價的討論再次成為熱點。Plus版從20美元漲到22美元,美區(qū)Team版從25美元漲到30美元,Claude在原有的20美元Pro版之外,新增了30美元的Team檔和Max檔
2025-12-01 17:31:04英偉達的瘋狂賬本昨天凌晨,我看著黃金盤的下跌心情沉重。這時,電腦瀏覽器推送了一條新聞,標題稱世界上最有價值的公司Nvidia遇到了新的美國對手。起初并未在意,以為是哪家芯片廠蹭熱點。但當我看到高通的名字時愣住了
2025-10-29 11:07:15高通芯片殺進英偉達腹地OpenAI 與超威半導體(AMD)達成協議,根據協議,OpenAI 或可收購這家芯片制造商 10% 的股份。消息公布后,AMD 股價在周一暴漲 23.71%
2025-10-07 09:18:47OpenAI背刺英偉達入股AMD