Flex:ai有何厲害之處破解算力資源浪費(fèi)難題

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-11-22 16:30:34 每日經(jīng)濟(jì)新聞

AI產(chǎn)業(yè)的迅速發(fā)展催生了巨大的算力需求，但全球算力資源利用率低的問(wèn)題日益突出。具體表現(xiàn)為小模型任務(wù)獨(dú)占整張GPU或NPU導(dǎo)致資源閑置，大模型任務(wù)則因單機(jī)算力不足而難以運(yùn)行，許多通用服務(wù)器由于缺乏GPU或NPU處于算力“休眠”狀態(tài)，供需不匹配造成了資源浪費(fèi)。

11月21日，在2025 AI容器應(yīng)用落地與發(fā)展論壇上，華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)布了AI容器技術(shù)Flex:ai。該技術(shù)通過(guò)算力切分，將單張GPU或NPU切分為多個(gè)虛擬算力單元，最小切分粒度可達(dá)10%。這使得單卡可以同時(shí)承載多個(gè)AI工作負(fù)載，提高了算力資源平均利用率約30%。

面對(duì)先進(jìn)制程受限及單顆AI芯片性能與國(guó)外存在差距的情況，F(xiàn)lex:ai延續(xù)了華為“以軟件補(bǔ)硬件”的策略。這項(xiàng)新技術(shù)還將對(duì)標(biāo)英偉達(dá)于2024年底收購(gòu)的以色列公司Run:ai。Run:ai基于Kubernetes構(gòu)建的軟件平臺(tái)，通過(guò)動(dòng)態(tài)調(diào)度、池化和分片等手段優(yōu)化GPU資源使用。例如，自動(dòng)駕駛公司W(wǎng)ayve利用Run:ai將其GPU集群效率從不到25%提升到80%以上。華為的Flex:ai同樣致力于通過(guò)軟件創(chuàng)新實(shí)現(xiàn)對(duì)包括英偉達(dá)、昇騰在內(nèi)的第三方算力進(jìn)行統(tǒng)一管理和調(diào)度，屏蔽底層硬件差異，為AI應(yīng)用提供更高效穩(wěn)定的資源支持。

與主要服務(wù)于英偉達(dá)GPU生態(tài)的Run:ai不同，F(xiàn)lex:ai沒(méi)有生態(tài)限制，支持英偉達(dá)GPU和華為昇騰NPU等多種算力卡。Flex:ai的能力已在實(shí)際場(chǎng)景中得到驗(yàn)證。瑞金醫(yī)院與華為合作開(kāi)發(fā)的多模態(tài)病理大模型“RuiPath”，用于識(shí)別19種常見(jiàn)癌癥的病理切片病灶區(qū)域。該模型基于103萬(wàn)張病理切片訓(xùn)練而成，僅用16張昇騰910B算力卡就完成了大規(guī)模訓(xùn)練。背后的技術(shù)支撐來(lái)自Flex:ai，它通過(guò)算力資源切分和智能任務(wù)調(diào)度等技術(shù)，將XPU資源可用度從40%提高到了70%，解決了有限算力下的大規(guī)模訓(xùn)練問(wèn)題。

IT研究與咨詢(xún)公司Gartner的分析師指出，目前大多數(shù)AI負(fù)載已采用容器化部署和運(yùn)行。預(yù)計(jì)到2027年，超過(guò)75%的AI工作負(fù)載將使用容器技術(shù)進(jìn)行部署和運(yùn)行。華為表示，F(xiàn)lex:ai將在發(fā)布后同步開(kāi)源在魔擎社區(qū)，并與華為此前開(kāi)源的多款A(yù)I工具共同構(gòu)成完整的ModelEngine開(kāi)源生態(tài)系統(tǒng)。

(責(zé)任編輯：zhangxiaohua)

關(guān)閉

Flex:ai有何厲害之處 破解算力資源浪費(fèi)難題

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

Flex:ai有何厲害之處破解算力資源浪費(fèi)難題