在2025華為全聯(lián)接大會上,華為副董事長、輪值董事長徐直軍公布了昇騰AI芯片未來三年的產(chǎn)品迭代路線圖。他表示,2026年一季度發(fā)布的新產(chǎn)品將采用華為自研HBM(高帶寬內(nèi)存)。根據(jù)規(guī)劃,2026年至2028年期間,華為將分階段推出四款昇騰系列芯片:2026年第一季度推出昇騰950PR,該芯片采用華為自研HBM;2026年第四季度推出昇騰950DT;2027年第四季度推出昇騰960芯片;2028年第四季度推出昇騰970。
與英偉達(dá)基于通用集成集成電路設(shè)計的GPU不同,華為昇騰芯片屬于專用集成集成電路架構(gòu)的NPU(神經(jīng)網(wǎng)絡(luò)處理器),專為處理神經(jīng)網(wǎng)絡(luò)計算任務(wù)設(shè)計。從2019年開始,華為已發(fā)布多款昇騰910系列芯片,包括910B、910C等產(chǎn)品。今年第一季度最新發(fā)布的910C基于華為自研的達(dá)芬奇架構(gòu),專為云端AI訓(xùn)練和推理使用。昇騰910C算力高達(dá)800TFLOPS(以行業(yè)衡量AI算力規(guī)模的半精度浮點數(shù)FP16為標(biāo)準(zhǔn)),支持多種數(shù)據(jù)格式,互聯(lián)帶寬784GB/s,HBM容量為128GB,內(nèi)存帶寬為3.2TB/s。
相比之下,英偉達(dá)最新Blackwell B300在同等標(biāo)準(zhǔn)下的算力約為3840TFLOPS,配備288GB HBM3e,帶寬為8TB/s。2026年將要發(fā)布的昇騰950PR/DT微架構(gòu)將升級為SIMD/SIMT,算力達(dá)到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持多種數(shù)據(jù)格式,互聯(lián)帶寬為2TB/s。內(nèi)存容量及帶寬上,昇騰950PR為128GB和1.6TB/s;昇騰950DT為144GB和4TB/s。
徐直軍指出,由于美國制裁,華為無法到臺積電投片,單顆芯片的算力相比英偉達(dá)存在差距。但華為有三十多年的技術(shù)積累,并在超節(jié)點互聯(lián)技術(shù)上實現(xiàn)突破,能夠做到萬卡級的超節(jié)點,從而提供強(qiáng)大的算力。借助超節(jié)點技術(shù),華為走“集群規(guī)模化”路線,通過高速總線互聯(lián)技術(shù)將多個CPU、GPU或NPU加速卡連接成一個超大的計算單元,彌補(bǔ)單芯片性能不足,實現(xiàn)算力供給。
此前,華為已經(jīng)推出了基于昇騰910芯片的超節(jié)點產(chǎn)品。今年5月推出的昇騰384超節(jié)點將384張昇騰NPU與192張鯤鵬CPU連接在一起,并在7月的世界人工智能大會上展出。在此次全聯(lián)接大會上,徐直軍還公布了華為最新的超節(jié)點產(chǎn)品Atlas 950 SuperPoD和Atlas 960 SuperPoD,分別支持8192及15488張昇騰卡。按照他在演講中展示的對比圖,Atlas 950 SuperPoD已超越英偉達(dá)將在2027年發(fā)布的最大規(guī)模超節(jié)點NVL576。Atlas 950 SuperPoD預(yù)計今年四季度上市,Atlas 960 SuperPoD計劃將在2027年四季度上市。
徐直軍多次強(qiáng)調(diào)算力對人工智能的重要性,尤其是對中國人工智能的發(fā)展。華為正在努力打造“超節(jié)點+集群”算力解決方案,以滿足持續(xù)增長的算力需求。