華為創(chuàng)始人任正非在接受采訪時(shí)表達(dá)了對(duì)芯片問題的信心,他表示憑借“疊加和集群”等方法,華為的計(jì)算能力已能與全球頂尖水平比肩。在全球半導(dǎo)體競爭激烈、技術(shù)封鎖加劇的情況下,這番表態(tài)令人振奮。
面對(duì)芯片制程的差距,華為通過系統(tǒng)級(jí)創(chuàng)新彌補(bǔ)單芯片性能不足。集群計(jì)算將多塊性能稍遜的芯片通過高效網(wǎng)絡(luò)連接,協(xié)同完成復(fù)雜任務(wù),形成強(qiáng)大的整體算力。華為的昇騰910B芯片就是一個(gè)例子,雖然在制程上不及國際領(lǐng)先的3nm芯片,但通過自研的CCE通信協(xié)議構(gòu)建高效集群,支持了盤古大模型的訓(xùn)練,整體算力可媲美部分頂級(jí)GPU。
科技企業(yè)在“以量補(bǔ)質(zhì)”策略方面不斷探索。谷歌的TPU集群是一個(gè)典型案例。盡管谷歌的TPU v4芯片單片性能略遜于英偉達(dá)A100,但谷歌通過Cloud TPU集群成功訓(xùn)練出5400億參數(shù)的PaLM模型。這證明在人工智能等擅長并行處理的任務(wù)領(lǐng)域,集群計(jì)算的規(guī)模效應(yīng)能夠有效彌補(bǔ)單芯片性能上的差距。
華為在算法優(yōu)化方面同樣表現(xiàn)出色。任正非提出的“用數(shù)學(xué)補(bǔ)物理”理念體現(xiàn)在采用稀疏計(jì)算、模型量化和剪枝等前沿技術(shù)手段,降低硬件性能依賴。華為的MindSpore框架通過動(dòng)態(tài)圖優(yōu)化和低精度計(jì)算,使AI訓(xùn)練的計(jì)算需求降低了30%以上。DeepSeek模型借助高效的模型壓縮技術(shù),在普通服務(wù)器上良好運(yùn)行,挑戰(zhàn)傳統(tǒng)高性能硬件的優(yōu)勢(shì)地位。這種軟硬件協(xié)同優(yōu)化模式幫助華為在制程相對(duì)較低的情況下依然實(shí)現(xiàn)高效計(jì)算。
天津港無人化碼頭運(yùn)營情況生動(dòng)詮釋了這一優(yōu)勢(shì)。數(shù)百塊昇騰芯片組成的計(jì)算集群在天津港無人化碼頭中發(fā)揮著關(guān)鍵作用,實(shí)時(shí)處理海量傳感器數(shù)據(jù),精準(zhǔn)指揮無人駕駛集卡和智能吊機(jī)。AI集群不僅提升了效率,降低了能耗,還讓碼頭工人從高強(qiáng)度體力勞動(dòng)中解放出來。
近日,在深圳華為總部,記者一行與華為首席執(zhí)行官任正非進(jìn)行了面對(duì)面交流,討論了一些大眾關(guān)心的熱點(diǎn)話題
2025-06-10 09:56:02任正非發(fā)聲