在資本市場(chǎng)熱度趨于平靜之際,摩爾線程再次吸引了人們的目光。12月20日,摩爾線程舉辦了首屆“MUSA開發(fā)者大會(huì)”,發(fā)布了新一代全功能GPU架構(gòu)“花港”、基于該架構(gòu)的AI訓(xùn)推一體芯片“華山”以及專用于高性能圖形渲染的芯片“廬山”。此外,摩爾線程創(chuàng)始人張建中還公布了“夸娥萬卡智算集群”和即將發(fā)布的MTT C256超節(jié)點(diǎn)結(jié)構(gòu)規(guī)劃。
除了這些技術(shù)迭代內(nèi)容,摩爾線程還展示了中間語言MTX、光刻計(jì)算庫和量子計(jì)算融合框架等意外的技術(shù)。雖然這些技術(shù)并非首次提出,但從國(guó)產(chǎn)GPU公司的角度來看,敢于全面搭建生態(tài)體系,這一點(diǎn)值得肯定。對(duì)于摩爾線程來說,這次開發(fā)者大會(huì)也向外界傳遞了一個(gè)明確信號(hào):無論行業(yè)如何評(píng)價(jià),公司都會(huì)堅(jiān)持以MUSA為核心,打造類似英偉達(dá)CUDA的生態(tài)系統(tǒng)。
中間語言MTX是本次大會(huì)上最令人震驚的技術(shù)之一。作為MUSA 5.0軟件棧的一部分,MTX旨在兼容不同代際GPU的指令架構(gòu),降低開發(fā)者適配成本,并為上層軟件提供穩(wěn)定的底層支持。這種技術(shù)在英偉達(dá)CUDA生態(tài)中被稱為PTX,通過PTX,開發(fā)者可以在不同代際的GPU上運(yùn)行相同的代碼。摩爾線程計(jì)劃在明年上半年向開發(fā)者開放自研的MTX,盡管其適用性可能不如英偉達(dá),但邁出這一步仍然令人刮目相看。
新發(fā)布的“花港”架構(gòu)在計(jì)算性能方面顯著提升,算力密度比前一代“平湖”提高了50%,并支持從FP4到FP64的全精度計(jì)算。此外,“花港”架構(gòu)還支持異步編程與超大規(guī)?;ヂ?lián),內(nèi)置AI生成式渲染結(jié)構(gòu),并支持DirectX 12 Ultimate?;谶@一架構(gòu),摩爾線程發(fā)布了兩款芯片:“廬山”和“華山”。
“廬山”芯片定位于AI訓(xùn)推一體,支持多種協(xié)議和擴(kuò)展,最高可支持1024片超節(jié)點(diǎn)的擴(kuò)展?!叭A山”則用于高性能圖形渲染,相比之前的MMT S80,AI計(jì)算性能提升了64倍,幾何處理性能提升了16倍,光線追蹤性能提升了50倍。
除了芯片,摩爾線程還發(fā)布了“夸娥萬卡智算集群”,具備全精度、全功能通用計(jì)算能力,在萬卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。今年國(guó)內(nèi)GPU行業(yè)的敘事逐漸從“能用”轉(zhuǎn)向“好用”,摩爾線程的答案仍聚焦于“生態(tài)”二字。公司在今天的開發(fā)者大會(huì)上推出了“長(zhǎng)江”SoC,面向端側(cè),通過CPU+GPU+NPU組合,提供高達(dá)50 TOPS的異構(gòu)AI算力。摩爾線程還將推出基于這款SoC的MT Robot具身智能解決方案,已在農(nóng)業(yè)場(chǎng)景中應(yīng)用。此外,公司還發(fā)布了MTT AIBOOK和迷你型計(jì)算設(shè)備MTT AI Cube,并推出了MT Lambda具身智能仿真訓(xùn)練平臺(tái),旨在提高研發(fā)效率。
通過這些布局,摩爾線程試圖在各個(gè)與計(jì)算相關(guān)的行業(yè)中占據(jù)一席之地,每一步都在拓展生態(tài)邊界,同時(shí)面臨諸多挑戰(zhàn)。這不僅是走一遍英偉達(dá)來時(shí)的路,也是在嘗試搭建另一條國(guó)產(chǎn)生態(tài)護(hù)城河。最終能否成功,還需要時(shí)間來檢驗(yàn)。