AI產(chǎn)業(yè)的迅速發(fā)展催生了巨大的算力需求,但全球算力資源利用率低的問(wèn)題日益突出。具體表現(xiàn)為小模型任務(wù)獨(dú)占整張GPU或NPU導(dǎo)致資源閑置,大模型任務(wù)則因單機(jī)算力不足而難以運(yùn)行,許多通用服務(wù)器由于缺乏GPU或NPU處于算力“休眠”狀態(tài),供需不匹配造成了資源浪費(fèi)。
11月21日,在2025 AI容器應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)布了AI容器技術(shù)Flex:ai。該技術(shù)通過(guò)算力切分,將單張GPU或NPU切分為多個(gè)虛擬算力單元,最小切分粒度可達(dá)10%。這使得單卡可以同時(shí)承載多個(gè)AI工作負(fù)載,提高了算力資源平均利用率約30%。
面對(duì)先進(jìn)制程受限及單顆AI芯片性能與國(guó)外存在差距的情況,F(xiàn)lex:ai延續(xù)了華為“以軟件補(bǔ)硬件”的策略。這項(xiàng)新技術(shù)還將對(duì)標(biāo)英偉達(dá)于2024年底收購(gòu)的以色列公司Run:ai。Run:ai基于Kubernetes構(gòu)建的軟件平臺(tái),通過(guò)動(dòng)態(tài)調(diào)度、池化和分片等手段優(yōu)化GPU資源使用。例如,自動(dòng)駕駛公司W(wǎng)ayve利用Run:ai將其GPU集群效率從不到25%提升到80%以上。華為的Flex:ai同樣致力于通過(guò)軟件創(chuàng)新實(shí)現(xiàn)對(duì)包括英偉達(dá)、昇騰在內(nèi)的第三方算力進(jìn)行統(tǒng)一管理和調(diào)度,屏蔽底層硬件差異,為AI應(yīng)用提供更高效穩(wěn)定的資源支持。
與主要服務(wù)于英偉達(dá)GPU生態(tài)的Run:ai不同,F(xiàn)lex:ai沒(méi)有生態(tài)限制,支持英偉達(dá)GPU和華為昇騰NPU等多種算力卡。Flex:ai的能力已在實(shí)際場(chǎng)景中得到驗(yàn)證。瑞金醫(yī)院與華為合作開(kāi)發(fā)的多模態(tài)病理大模型“RuiPath”,用于識(shí)別19種常見(jiàn)癌癥的病理切片病灶區(qū)域。該模型基于103萬(wàn)張病理切片訓(xùn)練而成,僅用16張昇騰910B算力卡就完成了大規(guī)模訓(xùn)練。背后的技術(shù)支撐來(lái)自Flex:ai,它通過(guò)算力資源切分和智能任務(wù)調(diào)度等技術(shù),將XPU資源可用度從40%提高到了70%,解決了有限算力下的大規(guī)模訓(xùn)練問(wèn)題。
IT研究與咨詢(xún)公司Gartner的分析師指出,目前大多數(shù)AI負(fù)載已采用容器化部署和運(yùn)行。預(yù)計(jì)到2027年,超過(guò)75%的AI工作負(fù)載將使用容器技術(shù)進(jìn)行部署和運(yùn)行。華為表示,F(xiàn)lex:ai將在發(fā)布后同步開(kāi)源在魔擎社區(qū),并與華為此前開(kāi)源的多款A(yù)I工具共同構(gòu)成完整的ModelEngine開(kāi)源生態(tài)系統(tǒng)。
中共中央政治局12月8日召開(kāi)會(huì)議,分析研究2026年經(jīng)濟(jì)工作
2025-12-08 14:14:21中共中央政治局