國(guó)內(nèi)各AI公司也在積極發(fā)力開(kāi)源模型。5月29日,DeepSeek宣布DeepSeekR1模型已完成小版本升級(jí),當(dāng)前版本為DeepSeek-R1-0528。該模型在數(shù)學(xué)、編程與通用邏輯等多個(gè)基準(zhǔn)測(cè)評(píng)中取得了優(yōu)異成績(jī),并且在整體表現(xiàn)上已接近其他國(guó)際頂尖模型。此次團(tuán)隊(duì)的開(kāi)源倉(cāng)庫(kù)(包括模型權(quán)重)仍然采用MIT License,并允許用戶利用模型輸出、通過(guò)模型蒸餾等方式訓(xùn)練其他模型。
5月14日晚,阿里正式開(kāi)源通義萬(wàn)相Wan2.1-VACE,單一模型可同時(shí)支持文生視頻、圖像參考視頻生成、視頻重繪等多種能力。此前,阿里亦于4月開(kāi)源新一代混合推理模型Qwen 3(千問(wèn)3)。截至4月底,阿里通義已開(kāi)源200余個(gè)模型,全球下載量超3億次,千問(wèn)衍生模型數(shù)超10萬(wàn)個(gè),成為全球最大的開(kāi)源模型族群。
智譜華章也在4月14日集中開(kāi)源GLM-Z1-Air等模型,包括9B與32B尺寸,涵蓋基座模型、推理模型和沉思模型。這些開(kāi)源模型可免費(fèi)用于商業(yè)用途、自由分發(fā),為開(kāi)發(fā)者提供了最大的使用和開(kāi)發(fā)自由度。最新模型上線智譜開(kāi)放平臺(tái)bigmodel后,當(dāng)天有超過(guò)6000家企業(yè)和開(kāi)發(fā)者接入,調(diào)用tokens日增幅超100%。