Claude的聲明為何引起波動(dòng)?因?yàn)樗兄幸ΑP蛯咏怦钣布?。Anthropic通過架構(gòu)優(yōu)化和推理引擎改進(jìn),降低對(duì)CUDA專屬指令的依賴,用標(biāo)準(zhǔn)ONNX格式部署。這使模型可以在AMD MI300X或Google TPU上運(yùn)行,理論上打破了硬件綁定。但仔細(xì)看會(huì)發(fā)現(xiàn),這是推理端的故事,訓(xùn)練端仍離不開A100。
市場最怕的不是技術(shù)替代,而是預(yù)期反轉(zhuǎn)?!?0分鐘鏟平護(hù)城河”這個(gè)說法雖然是誤傳,但傳播迅速。因?yàn)閿⑹绿恕Hf億市值建立在軟件生態(tài)上,如果算法進(jìn)步能讓硬件無關(guān)緊要,估值邏輯就得重寫。黃仁勛在CES上的回應(yīng)很到位:“軟件生態(tài)的價(jià)值不在代碼,在數(shù)百萬開發(fā)者積累的經(jīng)驗(yàn)與信任?!?/p>
值得關(guān)注的是云廠商的動(dòng)作。AWS搞SageMaker Neo、Google推JAX、微軟投ONNX Runtime,阿里云的“百煉”平臺(tái)宣稱無需改代碼就能跨芯片切換。這些服務(wù)表面上便利開發(fā)者,實(shí)際上是在構(gòu)建硬件抽象層。對(duì)云廠商來說,芯片成本是大頭,如果能讓客戶在不同硬件間無縫遷移,采購談判的籌碼就大了。這不是技術(shù)競爭,而是供應(yīng)鏈博弈。
去年國內(nèi)某自動(dòng)駕駛公司,訓(xùn)練還在A100上,但推理端全切到國產(chǎn)芯片,成本下降40%。這個(gè)數(shù)字很有意思——不是說國產(chǎn)芯片性能達(dá)到A100的60%,而是在特定場景下,通過軟硬協(xié)同優(yōu)化,達(dá)到了可接受的性價(jià)比臨界點(diǎn)。這種“局部替代”正在越來越多領(lǐng)域發(fā)生,尤其是推理端、邊緣設(shè)備、消費(fèi)級(jí)應(yīng)用。
政策因素也在加速這一進(jìn)程。歐盟IPCEI投60億歐元、日本2萬億日元基金、印度的IndiaAI計(jì)劃,表面上扶持本土半導(dǎo)體,實(shí)際上是用采購傾斜和資金引導(dǎo)為非CUDA生態(tài)創(chuàng)造生存空間。地緣政治不會(huì)直接擊穿技術(shù)壁壘,但會(huì)改變市場結(jié)構(gòu)。中國的昇騰、寒武紀(jì)、飛槳等體系,短期內(nèi)性能有差距,但在政策保護(hù)下已占據(jù)一定市場份額。