3月2日,在2026年世界移動通信大會期間,華為推出了智算超節(jié)點Atlas 950 SuperPoD、通算超節(jié)點TaiShan 950 SuperPoD等多個型號的超節(jié)點產(chǎn)品及解決方案。這是華為首次面向海外市場展示超節(jié)點算力集群。
目前,人工智能快速發(fā)展,每個月都有新的突破。智能體時代下,模型從僅限于大語言模型走向全模態(tài)的原生融合,萬億級的模型參數(shù)和10萬億級的數(shù)據(jù)訓(xùn)練成為標(biāo)配,算力需求提升十倍到百倍。同時,模型支持的上下文序列長度顯著增加,具備更長久的記憶能力,但對內(nèi)存容量和帶寬的需求也大幅提升。
隨著AI在行業(yè)應(yīng)用中的深入,實時性挑戰(zhàn)愈發(fā)凸顯。例如,在金融風(fēng)控場景中,時延要求小于20毫秒,反欺詐場景的時延則要在10毫秒以下。智能體還需要更多任務(wù)協(xié)同和多輪次推理迭代,傳統(tǒng)的計算架構(gòu)難以滿足低時延要求。
單一芯片的提升已經(jīng)無法滿足AI的算力需求,必須依賴多芯片互聯(lián)、做大規(guī)模計算節(jié)點的方式來解決。去年,華為發(fā)布了業(yè)界規(guī)模最大的超節(jié)點昇騰384超節(jié)點,通過將384顆昇騰AI芯片連接在一起組成集群,提供高達(dá)300PFLOPs的密集BF16算力,該性能表現(xiàn)接近英偉達(dá)GB200 NVL72系統(tǒng)的兩倍。
華為副董事長、輪值董事長徐直軍曾表示,盡管受到美國制裁,不能產(chǎn)出最先進(jìn)工藝制程的芯片,但基于過去30多年構(gòu)筑的聯(lián)接技術(shù)能力,華為能夠做到萬卡級的超節(jié)點,實現(xiàn)世界上最強的算力。他還披露了關(guān)于昇騰芯片、超節(jié)點、集群以及靈衢互聯(lián)協(xié)議在內(nèi)的規(guī)劃和未來演進(jìn)目標(biāo),包括此次在MWC 2026上亮相的產(chǎn)品。
所謂超節(jié)點,是指通過系統(tǒng)工程方法,將成千上萬顆芯片高效互聯(lián),形成一個邏輯統(tǒng)一的超級計算機,從而實現(xiàn)整體算力的跨越式增長。華為開創(chuàng)了面向超節(jié)點的互聯(lián)協(xié)議“靈衢”,可以把更多計算資源連接到一起。然而,集群也面臨能耗和占地面積等問題,昇騰384超節(jié)點在超越英偉達(dá)NVL72的同時,功耗也達(dá)到后者的4.1倍。
產(chǎn)品演進(jìn)方面,2025年3月,華為推出基于靈衢1.0的Atlas 900超節(jié)點,滿配支持384卡,已在多個行業(yè)實現(xiàn)商用部署。此后,在靈衢1.0基礎(chǔ)上進(jìn)行功能與規(guī)模優(yōu)化,形成靈衢2.0版本,此次華為展示的Atlas 950 SuperPoD便基于靈衢2.0演進(jìn)。華為計算產(chǎn)品線總裁張熙偉表示,Atlas 950 SuperPoD智算超節(jié)點以單柜64卡為基本單元,最大可支持8192張NPU卡高速互聯(lián),為超大規(guī)模AI訓(xùn)練與海量推理并發(fā)場景提供選擇;TaiShan 950 SuperPoD則是業(yè)界首款通算超節(jié)點,可以解決通算場景時延高、數(shù)據(jù)搬移開銷大、協(xié)同效率低的難題。
硬件性能的突破是基礎(chǔ),繁榮的軟件生態(tài)是昇騰能否長期繁榮的關(guān)鍵。華為全面開源開放CANN異構(gòu)計算架構(gòu),通過分層解耦,已經(jīng)將算子庫、加速庫、圖計算、編程語言等軟件代碼全量開源,支持開發(fā)者按需使用,加速自主創(chuàng)新。
在西班牙巴塞羅那舉行的MWC26期間,華為首次在海外展示了基于全新互聯(lián)協(xié)議“靈衢”(UnifiedBus)打造的最新超節(jié)點產(chǎn)品
2026-03-02 10:23:28華為首次海外發(fā)布超節(jié)點產(chǎn)品9月18日,午后華為算力概念持續(xù)走強,烽火通信直線漲停,興圖新科、星環(huán)科技、信安世紀(jì)漲超10%,神州數(shù)碼、高新發(fā)展、直真科技、拓維信息等跟漲
2025-09-18 18:00:35烽火通信午后漲停