人工智能數(shù)據(jù)中心的大規(guī)模建設(shè)和部署,從根本上改變了2納米及以下制程芯片的設(shè)計(jì)和制造格局。雖然從功耗角度來(lái)看,芯片尺寸的縮小仍然被視為優(yōu)勢(shì),性能方面也有一定提升,但光罩尺寸的芯片上可用的空間不足以處理生成式人工智能和智能人工智能所需的大量數(shù)據(jù)。因此,重點(diǎn)轉(zhuǎn)向多芯片封裝的芯片組,盡管名稱(chēng)如此,但這些芯片組的尺寸可以與光罩尺寸相同。
這帶來(lái)了一系列新的權(quán)衡取舍。對(duì)于定制化高級(jí)封裝中的多個(gè)芯片而言,面積不再是主要問(wèn)題,但數(shù)據(jù)的編排和傳輸變得極具挑戰(zhàn)性。解析人工智能計(jì)算是一個(gè)復(fù)雜的、大規(guī)模并行操作,其中處理過(guò)程可能被分配到不同的處理單元,最終將結(jié)果合并。自IBM在20世紀(jì)80年代首次大規(guī)模并行處理以來(lái),最后一步一直是個(gè)難題。
工作負(fù)載如今已成為首要的設(shè)計(jì)約束條件。大型語(yǔ)言模型訓(xùn)練和推理模式會(huì)在芯片上造成高度不均勻的壓力。即使是相同的芯片,瞬時(shí)峰值、局部熱點(diǎn)和長(zhǎng)時(shí)間的壓力模式也會(huì)產(chǎn)生截然不同的結(jié)果。忽略工作負(fù)載行為的設(shè)計(jì)要么會(huì)過(guò)度約束,要么會(huì)在實(shí)際應(yīng)用中顯得脆弱。
隨著芯片逐漸演變?yōu)橛蛇B接到某種中介層的微型芯片組成的集合體,這一點(diǎn)變得尤為重要。為了使用更細(xì)的導(dǎo)線在更長(zhǎng)的距離上傳輸更多數(shù)據(jù),還需要進(jìn)行其他方面的改進(jìn)。在最先進(jìn)的工藝節(jié)點(diǎn)上,需要采用新的材料和工藝,以提高先進(jìn)封裝內(nèi)部以及封裝之間長(zhǎng)距離傳輸電子(最終也包括光子)的遷移率,同時(shí)還要提高結(jié)構(gòu)穩(wěn)定性,并減少2.5D和3.5D結(jié)構(gòu)中的翹曲。
在這樣的尺寸下,規(guī)模經(jīng)濟(jì)和可重復(fù)性變得愈發(fā)重要。從2008年開(kāi)始,芯片行業(yè)著手將晶圓尺寸從300毫米過(guò)渡到450毫米,以期在一片晶圓上制造更多芯片,從而抵消不斷上漲的研發(fā)成本。然而,由于當(dāng)時(shí)能夠從450毫米晶圓中獲益的公司數(shù)量不足,這項(xiàng)計(jì)劃于2017年被擱置。