DeepSeek在MoE架構(gòu)方面的創(chuàng)新包括使用共享專家和路由專家兩種專家,提升了模型訓(xùn)練效率。此外,采用FP8混合精度技術(shù)替代傳統(tǒng)高精度運(yùn)算,降低了內(nèi)存需求并提升了計(jì)算性能。DeepSeek還摒棄了傳統(tǒng)的監(jiān)督學(xué)習(xí)微調(diào),采用純強(qiáng)化學(xué)習(xí)策略直接優(yōu)化推理能力,通過(guò)群體獎(jiǎng)勵(lì)優(yōu)化技術(shù)動(dòng)態(tài)調(diào)整模型輸出。
這些革新將推動(dòng)算力需求的結(jié)構(gòu)性增長(zhǎng),低成本模型加速了AI應(yīng)用普及,推理算力需求將呈指數(shù)級(jí)增長(zhǎng)。業(yè)內(nèi)多位專家認(rèn)為,DeepSeek的技術(shù)突破不僅體現(xiàn)在性能指標(biāo)上,更通過(guò)效率與成本的平衡推動(dòng)了AI技術(shù)的普惠化。據(jù)IDC數(shù)據(jù)顯示,2024年全球人工智能服務(wù)器市場(chǎng)規(guī)模將達(dá)到1251億美元,2028年有望達(dá)到2227億美元。
在中國(guó)市場(chǎng),智能算力規(guī)模預(yù)計(jì)將在2028年達(dá)到2781.9EFLOPS。DeepSeek的出現(xiàn)帶動(dòng)了算力市場(chǎng)的變革和發(fā)展,尤其是推理算力市場(chǎng)需求激增。DeepSeek降低了大模型的應(yīng)用開(kāi)發(fā)成本,讓更多中小用戶能夠接觸到這項(xiàng)技術(shù)。單機(jī)部署解決方案使得他們能夠以較低的成本和更簡(jiǎn)單的部署方式使用大模型。
DeepSeek推動(dòng)了算力基礎(chǔ)設(shè)施的發(fā)展,各大廠商推出了相關(guān)的一體機(jī)產(chǎn)品。例如,聯(lián)想、浪潮云、神州鯤泰等公司均推出了適配DeepSeek模型的一體機(jī)。算力服務(wù)模式也在從傳統(tǒng)IaaS向MaaS升級(jí),預(yù)置DeepSeek優(yōu)化模型提供端到端解決方案,降低了客戶算力采購(gòu)復(fù)雜度。目前正處于服務(wù)形態(tài)向MaaS轉(zhuǎn)變的初期,市場(chǎng)競(jìng)爭(zhēng)激烈,未來(lái)將有更多好用普惠的MaaS支持AI創(chuàng)新落地。
廣發(fā)證券指出,大模型的核心競(jìng)爭(zhēng)力在于算法、算力和數(shù)據(jù)的協(xié)同進(jìn)化
2025-02-22 00:18:26券商