國(guó)內(nèi)各AI公司也在積極發(fā)力開源模型。5月29日,DeepSeek宣布,DeepSeekR1模型已完成小版本升級(jí),當(dāng)前版本為DeepSeek-R1-0528。據(jù)介紹,DeepSeek-R1-0528仍然使用2024年12月所發(fā)布的DeepSeek V3 Base模型作為基座,但在后訓(xùn)練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新后的R1模型在數(shù)學(xué)、編程與通用邏輯等多個(gè)基準(zhǔn)測(cè)評(píng)中取得了優(yōu)異成績(jī),并且在整體表現(xiàn)上已接近其他國(guó)際頂尖模型。此次團(tuán)隊(duì)的開源倉(cāng)庫(kù)(包括模型權(quán)重)仍然統(tǒng)一采用MIT License,并允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
5月14日晚,阿里正式開源通義萬(wàn)相Wan2.1-VACE,單一模型可同時(shí)支持文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時(shí)長(zhǎng)延展等全系列生成和編輯能力。此前,阿里亦于4月開源新一代混合推理模型Qwen 3(千問3)。截至4月底,阿里通義已開源200余個(gè)模型,全球下載量超3億次,千問衍生模型數(shù)超10萬(wàn)個(gè),成為全球最大的開源模型族群。智譜華章也在4月14日集中開源GLM-Z1-Air等模型,包括9B與32B尺寸,涵蓋基座模型、推理模型和沉思模型。這些開源模型可免費(fèi)用于商業(yè)用途、自由分發(fā),為開發(fā)者提供了最大的使用和開發(fā)自由度。最新模型上線智譜開放平臺(tái)bigmodel后,當(dāng)天有超過6000家企業(yè)和開發(fā)者接入,調(diào)用tokens日增幅超100%。
2月4日,湖北省仙桃市漢江邊一名男子不慎落水危急關(guān)頭一位男子騎著一匹白馬沖入水中救人上演了一場(chǎng)生死救援01當(dāng)天下午
2025-02-06 09:32:02武俠小說場(chǎng)景照進(jìn)現(xiàn)實(shí)3月28日,外交部發(fā)言人郭嘉昆主持例行記者會(huì)。
2025-03-28 15:53:36外交部:堅(jiān)決反對(duì)英方炮制所謂“香港問題半年報(bào)告”