12月17日至19日,首屆光合組織人工智能創(chuàng)新大會(huì)在昆山國(guó)際會(huì)展中心舉行。會(huì)上,大規(guī)模智算超集群系統(tǒng)scaleX萬(wàn)卡超集群首次亮相。曙光數(shù)創(chuàng)憑借其浸沒(méi)相變液冷技術(shù),為該系統(tǒng)的超高密度算力提供了穩(wěn)定、可持續(xù)的基礎(chǔ)支撐。
scaleX萬(wàn)卡超集群由16個(gè)曙光scaleX640超節(jié)點(diǎn)通過(guò)高速網(wǎng)絡(luò)互連而成,可部署10240塊AI加速卡,總算力規(guī)模超過(guò)5EFlops,成為現(xiàn)場(chǎng)焦點(diǎn)。特定條件下,該系統(tǒng)單機(jī)柜算力密度較傳統(tǒng)方案提升約20倍,PUE值低至1.04,這得益于曙光數(shù)創(chuàng)的浸沒(méi)相變液冷技術(shù)。
在算力密度持續(xù)攀升的趨勢(shì)下,供電、散熱和可靠性成為制約系統(tǒng)穩(wěn)定性的關(guān)鍵因素。曙光數(shù)創(chuàng)的浸沒(méi)相變液冷整體解決方案支持單機(jī)柜900kW以上的功率輸出,確保了scaleX萬(wàn)卡超集群在高負(fù)載條件下的長(zhǎng)期穩(wěn)定運(yùn)行。該技術(shù)通過(guò)冷媒與發(fā)熱器件直接接觸,減少接觸熱阻,最高可實(shí)現(xiàn)200W/cm的散熱效率。此外,在高2800×寬3000×深1800mm的空間內(nèi)最多可部署160個(gè)計(jì)算節(jié)點(diǎn),單柜功率高達(dá)200kW,節(jié)省機(jī)房面積超過(guò)85%。曙光數(shù)創(chuàng)采用絕緣、環(huán)保的冷媒,對(duì)電子設(shè)備無(wú)腐蝕,對(duì)人體無(wú)危害。同時(shí),該技術(shù)采用DC400V直流供電,系統(tǒng)效率高達(dá)96%以上,滿足高功耗供電需求的同時(shí)減少配電損耗。利用15-35℃氣水作為冷源,可實(shí)現(xiàn)全年自然冷卻,相比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心節(jié)能超過(guò)30%。
液冷技術(shù)的規(guī)?;瘧?yīng)用離不開(kāi)長(zhǎng)期的實(shí)踐積累與產(chǎn)業(yè)驗(yàn)證。根據(jù)中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院等機(jī)構(gòu)聯(lián)合發(fā)布的報(bào)告,2024年曙光數(shù)創(chuàng)在中國(guó)算力中心基礎(chǔ)設(shè)施液冷溫控設(shè)備市場(chǎng)的出貨量占比達(dá)55.7%,市場(chǎng)份額連續(xù)四年位居國(guó)內(nèi)第一。曙光數(shù)創(chuàng)還牽頭制定了全國(guó)首個(gè)冷板式液冷國(guó)家標(biāo)準(zhǔn),并依托曙光數(shù)創(chuàng)(青島)產(chǎn)業(yè)創(chuàng)新基地,構(gòu)建起覆蓋量產(chǎn)、測(cè)試與驗(yàn)證的完整工程體系?;貎?nèi)的焓差實(shí)驗(yàn)室與理化實(shí)驗(yàn)室通過(guò)CNAS國(guó)際認(rèn)可,為液冷系統(tǒng)在不同應(yīng)用環(huán)境下的穩(wěn)定性評(píng)估提供支撐。
隨著開(kāi)放協(xié)同的產(chǎn)業(yè)共識(shí)形成,中國(guó)人工智能計(jì)算發(fā)展進(jìn)入快車道。曙光數(shù)創(chuàng)正以液冷這一關(guān)鍵技術(shù),參與并支撐新一輪產(chǎn)業(yè)工程化躍升,推動(dòng)更高密度、更高效率、更可持續(xù)的智算基礎(chǔ)設(shè)施的發(fā)展。