華為于6月30日正式宣布開源盤古70億參數(shù)的稠密模型、盤古Pro MoE 720億參數(shù)的混合專家模型以及基于昇騰的模型推理技術(shù),這是華為首次開源大模型。目前,盤古Pro MoE 72B模型權(quán)重和基礎(chǔ)推理代碼已上線開源平臺,基于昇騰的超大規(guī)模MoE模型推理代碼也已上線。盤古7B相關(guān)模型權(quán)重與推理代碼將在近期上線開源平臺。華為邀請全球開發(fā)者、企業(yè)伙伴及研究人員下載使用。
華為表示,此舉是其踐行昇騰生態(tài)戰(zhàn)略的關(guān)鍵舉措,旨在推動大模型技術(shù)的研究與創(chuàng)新發(fā)展,加速人工智能在各行各業(yè)的應(yīng)用與價值創(chuàng)造。達(dá)睿咨詢創(chuàng)始人馬繼華介紹,盤古70億參數(shù)的稠密模型采用全參數(shù)稠密結(jié)構(gòu),適合通用場景微調(diào),能夠靈活部署在邊緣設(shè)備上。而盤古Pro MoE 72B模型則采用混合專家架構(gòu),在保持推理效率的同時實現(xiàn)接近千億級稠密模型的性能,適用于高復(fù)雜度任務(wù)。華為通過差異化模型參數(shù)規(guī)模梯度覆蓋制造業(yè)、金融等不同場景需求,開源目的是推動大模型在行業(yè)中的應(yīng)用落地。馬繼華認(rèn)為,當(dāng)前人工智能領(lǐng)域的技術(shù)開放與生態(tài)共建至關(guān)重要,通過開源可以迅速形成產(chǎn)業(yè)優(yōu)勢,從而達(dá)成領(lǐng)跑,發(fā)揮人工智能的飛輪效應(yīng)。
DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1。該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能與美國OpenAI公司的最新o1大模型相當(dāng)
2025-01-21 22:05:22DeepSeek又有重大突破2月18日,階躍星辰與吉利汽車集團(tuán)宣布將合作研發(fā)的兩款Step系列多模態(tài)大模型向全球開發(fā)者開源
2025-02-18 11:53:56又一國產(chǎn)大模型宣布開源