在華為全聯(lián)接大會2025上,華為輪值董事長徐直軍分享了昇騰芯片的規(guī)劃路線,并推出了全球最強超節(jié)點和集群。未來三年直至2028年,華為開發(fā)和規(guī)劃了三個系列:Ascend 950、Ascend 960和Ascend 970。Ascend 950系列包括兩顆芯片:Ascend 950PR和Ascend 950DT。
結(jié)合已推出或正在研發(fā)中的昇騰芯片,華為將帶來更多超節(jié)點和集群產(chǎn)品,如Atlas 950超節(jié)點和Atlas 960超節(jié)點。Atlas 950超節(jié)點支持8192張昇騰卡,將在2026年四季度上市。而Atlas 960超節(jié)點最大可支持15488卡,預(yù)計于2027年四季度上市。
Ascend 950系列相比前一代,在多個方面實現(xiàn)了提升。新增支持FP8/MXFP8/MXFP4等低數(shù)值精度數(shù)據(jù)格式,算力分別達(dá)到1P和2P,提升了訓(xùn)練效率和推理吞吐。同時支持華為自研的HiF8,保持FP8高效的同時,精度接近FP16。向量算力也大幅提升,通過SIMD/SIMT雙編程模型和內(nèi)存訪問優(yōu)化實現(xiàn)?;ヂ?lián)帶寬提升至2TB/s。
Ascend 950PR主要面向推理Prefill階段和推薦業(yè)務(wù)場景,計劃于2026年一季度推出。Ascend 950DT則更注重推理Decode階段和訓(xùn)練場景,支持FP8/MXFP8/MXFP4/HiF8數(shù)據(jù)格式,計劃于2026年第四季度推出。Ascend 960將在2027年四季度推出,支持更多數(shù)據(jù)格式和更高帶寬。Ascend 970計劃在2028年四季度推出,各項指標(biāo)將進(jìn)一步升級。
從大型AI算力基礎(chǔ)設(shè)施建設(shè)的技術(shù)方向看,超節(jié)點已成為主導(dǎo)性產(chǎn)品形態(tài)。今年3月,華為推出了Atlas 900超節(jié)點,滿配支持384卡,最大算力可達(dá)300 PFLOPS。Atlas 950超節(jié)點支持8192張基于Ascend 950DT的昇騰卡,滿配包括128個計算柜和32個互聯(lián)柜,占地面積約1000平方米,F(xiàn)P8算力達(dá)到8E FLOPS,F(xiàn)P4算力達(dá)到16E FLOPS,互聯(lián)帶寬達(dá)到16PB/s。
Atlas 960超節(jié)點由176個計算柜和44個互聯(lián)柜組成,占地面積約2200平方米,F(xiàn)P8總算力將達(dá)到30E FLOPS,F(xiàn)P4總算力將達(dá)到60 EFLOPS,內(nèi)存容量達(dá)到4460TB,互聯(lián)帶寬達(dá)到34PB/s。大模型訓(xùn)練和推理性能相比Atlas 950超節(jié)點將分別提升3倍和4倍以上。
為了達(dá)成這些技術(shù)要求,華為開創(chuàng)了超節(jié)點架構(gòu)并發(fā)布了新型互聯(lián)協(xié)議“靈衢UnifiedBus”,支持萬卡級超節(jié)點架構(gòu)。該協(xié)議具備總線級互聯(lián)、平等協(xié)同、全量池化、協(xié)議歸一、大規(guī)模組網(wǎng)和高可用性六大特征。華為將開放靈衢2.0技術(shù)規(guī)范,歡迎產(chǎn)業(yè)界伙伴共同研發(fā)相關(guān)產(chǎn)品和部件。
此外,華為還推出了兩個集群產(chǎn)品:Atlas 950 SuperCluster 50萬卡集群和Atlas 960 SuperCluster。Atlas 950 SuperCluster由64個Atlas 950超節(jié)點互聯(lián)組成,F(xiàn)P8總算力可達(dá)524 EFLOPS,將于2026年Q4上市。Atlas 960 SuperCluster將在2027年Q4推出,集群規(guī)模進(jìn)一步提升到百萬卡級,F(xiàn)P8總算力達(dá)到2 ZFLOPS,F(xiàn)P4總算力達(dá)到4 ZFLOPS。