在2025華為全聯(lián)接大會上,華為副董事長、輪值董事長徐直軍公布了昇騰AI芯片未來三年的產(chǎn)品迭代路線圖。他表示,2026年一季度發(fā)布的新產(chǎn)品將采用華為自研HBM(高帶寬內(nèi)存)。根據(jù)規(guī)劃,2026年至2028年期間,華為將分階段推出四款昇騰系列芯片:2026年第一季度推出昇騰950PR,該芯片采用華為自研HBM;2026年第四季度推出昇騰950DT;2027年第四季度推出昇騰960芯片;2028年第四季度推出昇騰970。
與英偉達基于通用集成集成電路設(shè)計的GPU不同,華為昇騰芯片屬于專用集成集成電路架構(gòu)的NPU(神經(jīng)網(wǎng)絡(luò)處理器),專為處理神經(jīng)網(wǎng)絡(luò)計算任務(wù)設(shè)計。從2019年開始,華為已發(fā)布多款昇騰910系列芯片,包括910B、910C等產(chǎn)品。今年第一季度最新發(fā)布的910C基于華為自研的達芬奇架構(gòu),專為云端AI訓(xùn)練和推理使用。昇騰910C算力高達800TFLOPS(以行業(yè)衡量AI算力規(guī)模的半精度浮點數(shù)FP16為標(biāo)準(zhǔn)),支持多種數(shù)據(jù)格式,互聯(lián)帶寬784GB/s,HBM容量為128GB,內(nèi)存帶寬為3.2TB/s。
相比之下,英偉達最新Blackwell B300在同等標(biāo)準(zhǔn)下的算力約為3840TFLOPS,配備288GB HBM3e,帶寬為8TB/s。2026年將要發(fā)布的昇騰950PR/DT微架構(gòu)將升級為SIMD/SIMT,算力達到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持多種數(shù)據(jù)格式,互聯(lián)帶寬為2TB/s。內(nèi)存容量及帶寬上,昇騰950PR為128GB和1.6TB/s;昇騰950DT為144GB和4TB/s。
徐直軍指出,由于美國制裁,華為無法到臺積電投片,單顆芯片的算力相比英偉達存在差距。但華為有三十多年的技術(shù)積累,并在超節(jié)點互聯(lián)技術(shù)上實現(xiàn)突破,能夠做到萬卡級的超節(jié)點,從而提供強大的算力。借助超節(jié)點技術(shù),華為走“集群規(guī)?;甭肪€,通過高速總線互聯(lián)技術(shù)將多個CPU、GPU或NPU加速卡連接成一個超大的計算單元,彌補單芯片性能不足,實現(xiàn)算力供給。