華為超級(jí)節(jié)點(diǎn)挑戰(zhàn)英偉達(dá)霸權(quán) 開源打破壟斷!2025年9月,華為即將召開全面開源開放專題會(huì)議,這場(chǎng)原本技術(shù)圈的專業(yè)會(huì)議正悄然引發(fā)全球產(chǎn)業(yè)的高度關(guān)注。
九月的一個(gè)平常早晨,北京中關(guān)村某科技公司的AI工程師張偉打開電腦,驚喜地發(fā)現(xiàn)華為開源社區(qū)發(fā)布了架構(gòu)的最新代碼庫(kù)。他不再需要申請(qǐng)?zhí)厥鈾?quán)限,就能直接訪問(wèn)華為昇騰芯片的核心開發(fā)工具。與此同時(shí),在美國(guó)加州圣克拉市,英偉達(dá)總部的高級(jí)工程師團(tuán)隊(duì)正在緊急開會(huì),討論如何應(yīng)對(duì)華為這一舉動(dòng)。他們知道,這不僅僅是技術(shù)的競(jìng)爭(zhēng),更是生態(tài)系統(tǒng)的對(duì)決。
英偉達(dá)的CUDA生態(tài)并非一朝一夕建成。2006年,當(dāng)英偉達(dá)推出并行計(jì)算平臺(tái)時(shí),很少有人預(yù)見(jiàn)到它將成為時(shí)代的“隱形操作系統(tǒng)”。經(jīng)過(guò)近20年的發(fā)展,CUDA已經(jīng)成為一個(gè)龐大且完善的體系,擁有超過(guò)400萬(wàn)開發(fā)人員,支持多個(gè)應(yīng)用程序,累計(jì)下載量達(dá)4500萬(wàn)次。幾乎所有主流深度學(xué)習(xí)框架如PyTorch和TensorFlow等都原生支持CUDA。在深度學(xué)習(xí)訓(xùn)練、科學(xué)研究、圖像處理等領(lǐng)域,CUDA幾乎成為默認(rèn)選擇。這種壟斷地位帶來(lái)的不僅是技術(shù)優(yōu)勢(shì),還有巨大的商業(yè)壁壘。從CUDA遷移到其他平臺(tái),開發(fā)者往往需要重寫大量代碼,面臨高昂的遷移成本。
2025年8月,華為輪值董事長(zhǎng)徐直軍在昇騰計(jì)算產(chǎn)業(yè)發(fā)展峰會(huì)上宣布,華為昇騰硬件使能將全面開源開放,Mind系列應(yīng)用使能套件及工具鏈也將全面開源。一個(gè)月后的9日,華為將召開全面開源開放專題會(huì)議,進(jìn)一步推動(dòng)這一開源計(jì)劃的落地。CANN是華為面向推出的端云一致的異構(gòu)計(jì)算架構(gòu),能夠?yàn)楦鞣N人工智能模型和算法提供統(tǒng)一接入和運(yùn)行環(huán)境,通過(guò)協(xié)同調(diào)度設(shè)備的CPU等硬件資源,實(shí)現(xiàn)高效設(shè)備端智能計(jì)算性能優(yōu)化。CANN平臺(tái)的目的很明確:就是要打破英偉達(dá)對(duì)于開發(fā)生態(tài)的壟斷,提供在國(guó)產(chǎn)芯片上構(gòu)建應(yīng)用的替代平臺(tái)。
從技術(shù)架構(gòu)看,CANN和CUDA都扮演著連接上層AI框架與底層芯片的核心角色。CUDA允許開發(fā)者利用英偉達(dá)GPU的并行計(jì)算能力,將數(shù)據(jù)并行構(gòu)造擴(kuò)展到C語(yǔ)言編程中,實(shí)現(xiàn)復(fù)雜計(jì)算任務(wù)的加速。CANN則支持針對(duì)神經(jīng)網(wǎng)絡(luò)模型運(yùn)算的專用指令集,可將神經(jīng)網(wǎng)絡(luò)算子離線編譯成NPU的專用指令序列,還能實(shí)現(xiàn)層間算子融合,減少DDR讀寫帶寬,提升性能。兼容性方面,CANN已能兼容80%的CUDA API,支持85%算子自動(dòng)轉(zhuǎn)換。在部分場(chǎng)景中,CANN已經(jīng)具備了與國(guó)際產(chǎn)品競(jìng)爭(zhēng)的實(shí)力。生態(tài)建設(shè)上,CUDA擁有先發(fā)優(yōu)勢(shì),而CANN起步較晚但發(fā)展迅速。華為通過(guò)APN(昇騰伙伴計(jì)劃),已發(fā)展100多家伙伴,累計(jì)開發(fā)多款產(chǎn)品。
華為CANN開源的同時(shí),國(guó)產(chǎn)芯片產(chǎn)業(yè)正迎來(lái)集體崛起。2025年上半年,以寒武紀(jì)為代表的國(guó)產(chǎn)芯片廠商表現(xiàn)亮眼。寒武紀(jì)上半年實(shí)現(xiàn)營(yíng)業(yè)收入28.81億元,同比增長(zhǎng)4347.82%。昆侖芯科技中標(biāo)中國(guó)移動(dòng)集采項(xiàng)目十億級(jí)訂單,在中國(guó)移動(dòng)2025年至2026年人工智能通用計(jì)算設(shè)備集中采購(gòu)項(xiàng)目中,昆侖芯在“類生態(tài)”的標(biāo)包1、標(biāo)包2和標(biāo)包3中標(biāo)份額分別為70%、100%。海光信息2025年上半年實(shí)現(xiàn)營(yíng)業(yè)收入54.64億元,同比增長(zhǎng)45.21%。這些國(guó)產(chǎn)芯片廠商的應(yīng)用場(chǎng)景正從科技公司內(nèi)部自用為主,拓展至電信等重要領(lǐng)域。AI芯片國(guó)產(chǎn)替代已經(jīng)由“測(cè)試和試用”走向“大規(guī)模放量”的實(shí)質(zhì)性階段。
業(yè)內(nèi)認(rèn)為,開源開放CANN架構(gòu)是改變芯片格局的重要一步。許多中國(guó)開發(fā)者選用英偉達(dá)的原因在于其平臺(tái)多年來(lái)已成為行業(yè)默認(rèn)的開發(fā)環(huán)境。華為開源昇騰CANN架構(gòu),是中國(guó)產(chǎn)業(yè)的重要轉(zhuǎn)折。開發(fā)者可以像搭積木般自由組合算力模塊,打破技術(shù)壟斷的同時(shí),為國(guó)產(chǎn)基礎(chǔ)軟件協(xié)同發(fā)展開辟新路徑。這種以開源促協(xié)同、以生態(tài)破壁壘的創(chuàng)新實(shí)踐,或?qū)⒊蔀槠平鈬?guó)產(chǎn)AI卡脖子困局的關(guān)鍵密鑰。清華大學(xué)計(jì)算機(jī)系教授翟季冬指出:“目前國(guó)內(nèi)算力硬件水平已經(jīng)接近甚至超過(guò)了英偉達(dá)同類芯片,但在軟件生態(tài)上仍有提升空間?!蓖晟栖浖鷳B(tài),底層系統(tǒng)中的調(diào)度器、內(nèi)存管理、容錯(cuò)系統(tǒng)、存儲(chǔ)系統(tǒng),中層的編程語(yǔ)言、AI編譯器、算子庫(kù),上層的編程框架、通信庫(kù)和并行系統(tǒng)幾乎缺一不可。
華為開源CANN的決策,發(fā)生在全球算力需求爆增的背景下。OpenAI已與Oracle公司簽訂了價(jià)值3000億美元的算力購(gòu)買訂單,為期約5年。作為大模型領(lǐng)域的領(lǐng)先公司,OpenAI對(duì)算力基礎(chǔ)設(shè)施的大規(guī)模投資是行業(yè)前瞻指標(biāo)。Bernstein 7月發(fā)布的研報(bào)表示,2025年國(guó)內(nèi)芯片需求將達(dá)到395億美元,芯片市場(chǎng)的本土化率將從2023年的17%增長(zhǎng)到2027年的55%??萍季揞^在AI芯片領(lǐng)域的動(dòng)作頻頻,百度、阿里巴巴等公司紛紛加碼自研芯片,試圖在激烈的市場(chǎng)競(jìng)爭(zhēng)中掌握主動(dòng)權(quán)。阿里宣布未來(lái)三年投入3800億元建設(shè)云和硬件基礎(chǔ)設(shè)施,百度則推出了昆侖芯超節(jié)點(diǎn)在百舸計(jì)算平臺(tái)5.0版本上可用。
盡管CANN取得了顯著進(jìn)展,但與英偉達(dá)相比,仍存在一定差距。CUDA擁有先發(fā)優(yōu)勢(shì),已構(gòu)建起極為龐大和完善的生態(tài)系統(tǒng)。在生態(tài)豐富度和易用性上,CANN仍有差距,需要更多時(shí)間和努力來(lái)吸引開發(fā)者,完善工具和庫(kù)資源,提升整體生態(tài)的成熟度。從AI技術(shù)的發(fā)展方向來(lái)看,大模型是算力需求量最大的下游應(yīng)用領(lǐng)域。基于英偉達(dá)在深度學(xué)習(xí)訓(xùn)練領(lǐng)域占據(jù)主導(dǎo)地位,全球眾多大型模型訓(xùn)練幾乎都依賴英偉達(dá)及其生態(tài)。英偉達(dá)通過(guò)硬件與CUDA的強(qiáng)綁定構(gòu)建了難以撼動(dòng)的生態(tài)優(yōu)勢(shì)。這種封閉性雖保障了技術(shù)一致性,卻也引發(fā)開發(fā)者不滿。ZLUDA等轉(zhuǎn)譯層項(xiàng)目的夭折以及英偉達(dá)明文禁止轉(zhuǎn)譯技術(shù)的強(qiáng)硬態(tài)度,進(jìn)一步凸顯其維護(hù)壟斷地位的決心。
CANN與英偉達(dá)的競(jìng)爭(zhēng),本質(zhì)上是兩種生態(tài)發(fā)展邏輯的差異。開源如同“眾人拾柴”,可能加速技術(shù)普惠但需面對(duì)碎片化風(fēng)險(xiǎn);封閉似“精耕細(xì)作”,能保證體驗(yàn)統(tǒng)一卻可能形成技術(shù)霸權(quán)。當(dāng)下AI行業(yè)既需要華為這類打破壟斷的嘗試,也離不開已驗(yàn)證的成功經(jīng)驗(yàn)。未來(lái)可能不屬于非此即彼的選擇,而在于找到開放與可控的動(dòng)態(tài)平衡點(diǎn)。這場(chǎng)生態(tài)之爭(zhēng)的終局,將由開發(fā)者用代碼投票決定。在AI時(shí)代,最寶貴的從來(lái)不是硬件算力,而是匯聚在生態(tài)中的集體智慧。
深圳華為總部會(huì)議室里,幾位CANN架構(gòu)核心開發(fā)人員正在做最后的準(zhǔn)備。9月19日的開源專題會(huì)議將是華為向全球開發(fā)者社區(qū)的一次正式亮相。他們知道,開源只是開始。真正的挑戰(zhàn)在于如何吸引全球開發(fā)者共同建設(shè)這個(gè)新生態(tài),如何讓CANN從“能用”變?yōu)椤昂糜谩保瑥摹疤娲x擇”變?yōu)椤笆走x平臺(tái)”。窗外,夜幕降臨,但辦公樓依然燈火通明。在這場(chǎng)關(guān)乎AI芯片生態(tài)未來(lái)的競(jìng)爭(zhēng)中,沒(méi)有人愿意提前下班。