目前,模型輕量化、推理去中心化和芯片低功耗化三個(gè)方向同時(shí)發(fā)力,推動(dòng)算力平權(quán)。UNESCO和UCL的研究表明,刪掉大模型中的冗余部分可以大幅降低能耗。AMD CTO Mark Papermaster指出,AI推理正從數(shù)據(jù)中心向終端遷移。高通則致力于提高每瓦推理產(chǎn)出,成為AI世界的“節(jié)能電廠”。這些變化使得算力逐漸從集中走向分布,智能更加貼近用戶。
未來(lái)的新平衡中,老玩家不會(huì)被淘汰,而是會(huì)換一種方式留下來(lái)。英偉達(dá)可能會(huì)從“造卡公司”轉(zhuǎn)變?yōu)椤癆I的微軟”,提供系統(tǒng)和服務(wù)。谷歌、亞馬遜、微軟等云巨頭也在自研芯片,減少對(duì)英偉達(dá)的依賴。真正的博弈在于生態(tài)層,各大公司都在努力構(gòu)建自己的生態(tài)系統(tǒng),爭(zhēng)奪用戶的黏性。技術(shù)只是入口,最終目標(biāo)是控制力。當(dāng)AI和人重新建立連接時(shí),技術(shù)才算真正找到了自己的位置。