中科曙光國家先進計算產(chǎn)業(yè)創(chuàng)新中心有限公司宣布,海光信息技術(shù)團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的國產(chǎn)化適配,并正式上線。用戶可以在“光合開發(fā)者社區(qū)”的“光源”板塊訪問并下載相關(guān)模型,或登錄光源官網(wǎng)搜索“DeepSeek”,基于DCU平臺部署和使用這些模型。
DeepSeek V3和R1模型基于Transformer架構(gòu),采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù)。MLA通過減少KV緩存顯著降低了內(nèi)存占用,提升了推理效率;DeepSeek MoE則通過輔助損失實現(xiàn)了專家負(fù)載的智能平衡,進一步優(yōu)化了模型性能。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計算解決方案。目前,DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
AI芯片巨頭英偉達(dá)公司發(fā)表聲明,稱DeepSeek發(fā)布的新模型是一項出色的AI進步,符合美國技術(shù)出口管制規(guī)定
2025-01-29 05:00:03英偉達(dá)回應(yīng)DeepSeek模型