不過,純SRAM方案在容量上無法勝任當(dāng)前動輒千億、萬億參數(shù)的大模型。莊昌磊表示,英偉達(dá)可能采用類似AMD 3D V-Cache的技術(shù),通過臺積電的SoIC混合鍵合技術(shù),將專為推理加速設(shè)計的、包含大量SRAM的LPU單元直接3D堆疊在GPU核心晶圓上。
對于3D堆疊方案,AMD等頭部廠商已有布局。2021年AMD公布3D垂直緩存技術(shù),可將額外的7nm SRAM緩存垂直堆疊在Ryzen計算小芯片的頂部。2024年富士通介紹旗下MONAKA處理器采用3D SRAM技術(shù),計劃2027年出貨。東方證券認(rèn)為,SRAM 3D堆疊方案可通過垂直堆疊存儲單元的方法提升密度,規(guī)避傳統(tǒng)SRAM容量受面積密度限制的問題。中信證券也認(rèn)為,未來的GPU與NPU都有可能采用3D堆疊SRAM的方式,實現(xiàn)訪存帶寬的飛躍,吸收LPU的優(yōu)勢,同時保持原有的軟件生態(tài)無需變動。
莊昌磊指出,復(fù)雜的AI芯片可能需要同時用SoIC堆疊LPU和GPU核心,再通過CoWoS與HBM封裝在一起。對于一些特定的、不需要HBM容量的純推理芯片,確實可以完全依靠3D堆疊SRAM來構(gòu)建,但這些芯片面向的是細(xì)分市場,量級難以撼動HBM+CoWoS的主流地位。SRAM 3D堆疊需要在晶圓制造階段進(jìn)行精確的晶圓對晶圓鍵合,技術(shù)和工藝與前端制造深度耦合,進(jìn)一步將價值從前道封裝前移。先進(jìn)制程的價值被進(jìn)一步放大,本土封測廠可能面臨被“擠出”高端市場的風(fēng)險,但也帶來了差異化競爭機(jī)遇。