華為創(chuàng)始人任正非在接受采訪時(shí)表達(dá)了對(duì)芯片問(wèn)題的信心,他表示憑借“疊加和集群”等方法,華為的計(jì)算能力已能與全球頂尖水平比肩。在全球半導(dǎo)體競(jìng)爭(zhēng)激烈、技術(shù)封鎖加劇的情況下,這番表態(tài)令人振奮。
面對(duì)芯片制程的差距,華為通過(guò)系統(tǒng)級(jí)創(chuàng)新彌補(bǔ)單芯片性能不足。集群計(jì)算將多塊性能稍遜的芯片通過(guò)高效網(wǎng)絡(luò)連接,協(xié)同完成復(fù)雜任務(wù),形成強(qiáng)大的整體算力。華為的昇騰910B芯片就是一個(gè)例子,雖然在制程上不及國(guó)際領(lǐng)先的3nm芯片,但通過(guò)自研的CCE通信協(xié)議構(gòu)建高效集群,支持了盤(pán)古大模型的訓(xùn)練,整體算力可媲美部分頂級(jí)GPU。
科技企業(yè)在“以量補(bǔ)質(zhì)”策略方面不斷探索。谷歌的TPU集群是一個(gè)典型案例。盡管谷歌的TPU v4芯片單片性能略遜于英偉達(dá)A100,但谷歌通過(guò)Cloud TPU集群成功訓(xùn)練出5400億參數(shù)的PaLM模型。這證明在人工智能等擅長(zhǎng)并行處理的任務(wù)領(lǐng)域,集群計(jì)算的規(guī)模效應(yīng)能夠有效彌補(bǔ)單芯片性能上的差距。
華為在算法優(yōu)化方面同樣表現(xiàn)出色。任正非提出的“用數(shù)學(xué)補(bǔ)物理”理念體現(xiàn)在采用稀疏計(jì)算、模型量化和剪枝等前沿技術(shù)手段,降低硬件性能依賴。華為的MindSpore框架通過(guò)動(dòng)態(tài)圖優(yōu)化和低精度計(jì)算,使AI訓(xùn)練的計(jì)算需求降低了30%以上。DeepSeek模型借助高效的模型壓縮技術(shù),在普通服務(wù)器上良好運(yùn)行,挑戰(zhàn)傳統(tǒng)高性能硬件的優(yōu)勢(shì)地位。這種軟硬件協(xié)同優(yōu)化模式幫助華為在制程相對(duì)較低的情況下依然實(shí)現(xiàn)高效計(jì)算。
天津港無(wú)人化碼頭運(yùn)營(yíng)情況生動(dòng)詮釋了這一優(yōu)勢(shì)。數(shù)百塊昇騰芯片組成的計(jì)算集群在天津港無(wú)人化碼頭中發(fā)揮著關(guān)鍵作用,實(shí)時(shí)處理海量傳感器數(shù)據(jù),精準(zhǔn)指揮無(wú)人駕駛集卡和智能吊機(jī)。AI集群不僅提升了效率,降低了能耗,還讓碼頭工人從高強(qiáng)度體力勞動(dòng)中解放出來(lái)。
華為的底氣不僅源于技術(shù),還在于其開(kāi)放包容的戰(zhàn)略眼光。任正非強(qiáng)調(diào)“利用別人先進(jìn)成果”,促使華為在全球技術(shù)生態(tài)中積極作為、靈活應(yīng)變。即便面臨制裁困境,華為依然通過(guò)與開(kāi)源社區(qū)及國(guó)際伙伴的深度合作整合資源。例如,昇騰芯片與PyTorch等主流開(kāi)源框架兼容,降低了開(kāi)發(fā)者的遷移成本;Atlas平臺(tái)則通過(guò)軟硬件協(xié)同構(gòu)建獨(dú)特競(jìng)爭(zhēng)力。
AMD的崛起為華為提供了借鑒。AMD曾被英特爾壓制,但CEO Lisa Su帶領(lǐng)團(tuán)隊(duì)采用模塊化設(shè)計(jì)(Chiplet)和高效互聯(lián)技術(shù),推出Zen架構(gòu)處理器,強(qiáng)調(diào)架構(gòu)和生態(tài)而非單一制程。AMD的EPYC處理器在2020年占據(jù)全球服務(wù)器市場(chǎng)約15%的份額。這一成功經(jīng)驗(yàn)與華為聚焦5G基站和AI計(jì)算等特定場(chǎng)景,通過(guò)針對(duì)性優(yōu)化使效率遠(yuǎn)超通用芯片的集群策略有異曲同工之妙。
Chiplet技術(shù)是任正非戰(zhàn)略思想在工程實(shí)踐中的體現(xiàn)。該技術(shù)通過(guò)架構(gòu)革新和系統(tǒng)級(jí)優(yōu)化,彌補(bǔ)了單芯片制程上的代際差距,實(shí)現(xiàn)了整體性能的實(shí)用化突破。傳統(tǒng)“摩爾定律”依賴制程微縮提升性能,但先進(jìn)制程面臨物理極限和外部封鎖。Chiplet技術(shù)將復(fù)雜的大芯片拆解為多個(gè)功能明確的小芯粒,根據(jù)功能需求采用不同工藝節(jié)點(diǎn)制造。通過(guò)2.5D/3D集成等先進(jìn)封裝技術(shù),將這些異構(gòu)芯粒高密度、高性能地集成在一起,從而在系統(tǒng)層面實(shí)現(xiàn)媲美甚至超越單一先進(jìn)制程大芯片的性能和功能。
然而,Chiplet架構(gòu)也面臨芯粒間高速、低功耗、高帶寬互連的挑戰(zhàn)。華為在高速SerDes、先進(jìn)封裝中的互連線設(shè)計(jì)、信號(hào)/電源完整性仿真以及低延遲高帶寬的互連協(xié)議等方面投入巨大,通過(guò)復(fù)雜的算法優(yōu)化數(shù)據(jù)傳輸路徑,降低噪聲干擾,提升能效比,克服物理距離、封裝寄生效應(yīng)帶來(lái)的信號(hào)衰減和延遲等限制,確保多個(gè)芯粒高效協(xié)同工作。
華為深刻認(rèn)識(shí)到人才的重要性。華為擁有約11.4萬(wàn)名研發(fā)人員,過(guò)去十年研發(fā)投入超過(guò)1.2萬(wàn)億元?!疤觳派倌辍庇?jì)劃吸引了眾多頂尖人才。這些人才深入?yún)⑴c昇騰AI芯片的架構(gòu)設(shè)計(jì),確保硬件原生高效支持稀疏特性,實(shí)現(xiàn)了算法創(chuàng)新與芯片設(shè)計(jì)的深度協(xié)同。
盡管如此,挑戰(zhàn)依然存在。集群計(jì)算在能耗、成本以及通信瓶頸等方面仍有待突破。在對(duì)單線程性能要求極高的部分科學(xué)計(jì)算場(chǎng)景中,集群優(yōu)勢(shì)難以充分發(fā)揮。若華為能在芯片制造、供應(yīng)鏈穩(wěn)定性和全球化布局上持續(xù)精進(jìn),便能在更廣泛的領(lǐng)域與國(guó)際巨頭一較高下。
任正非“芯片無(wú)需擔(dān)憂”的宣言背后,正是華為在集群計(jì)算、算法優(yōu)化和生態(tài)協(xié)作等方面的深厚技術(shù)積累,以及其對(duì)人才和教育的長(zhǎng)期戰(zhàn)略性投入。當(dāng)硬件發(fā)展受限時(shí),系統(tǒng)創(chuàng)新和生態(tài)協(xié)作成為破局的關(guān)鍵力量。
近日,在深圳華為總部,記者一行與華為首席執(zhí)行官任正非進(jìn)行了面對(duì)面交流,討論了一些大眾關(guān)心的熱點(diǎn)話題
2025-06-10 09:56:02任正非發(fā)聲