DeepSeek帶飛國(guó)內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 07:28:24 每日經(jīng)濟(jì)新聞

今日A股市場(chǎng)迎來龍年收官戰(zhàn)，三大指數(shù)走勢(shì)分化明顯。收盤時(shí)，滬指跌0.06%，創(chuàng)業(yè)板指跌2.73%，收?qǐng)?bào)2063.82點(diǎn)。滬深兩市成交額達(dá)到11179億元，較上周五縮量1041億。

值得注意的是，DeepSeek概念股領(lǐng)漲，AI智能體、AI語料等概念股表現(xiàn)強(qiáng)勁。與此同時(shí)，算力板塊的銅高速連接、CPO等方向則紛紛領(lǐng)跌，仕佳光子跌超16%，兆龍互連、天孚通信等跌超10%。

上述現(xiàn)象主要源于國(guó)產(chǎn)大模型DeepSeek在美區(qū)App Store免費(fèi)榜登頂，并在國(guó)內(nèi)App Store免費(fèi)榜同樣位居第一。DeepSeek和ChatGPT躋身美區(qū)App Store免費(fèi)榜前三，展現(xiàn)出中國(guó)應(yīng)用程序的影響力。DeepSeek推理大模型DeepSeek-R1發(fā)布已近一周，開源模型DeepSeek-V3也已發(fā)布近一個(gè)月。DeepSeek-V3僅用2048塊H800 GPU完成6710億參數(shù)模型訓(xùn)練，成本僅為557.6萬美元，遠(yuǎn)低于其他頂級(jí)模型如GPT-4的10億美元。

受此利好影響，國(guó)內(nèi)DeepSeek概念股受到追捧，相關(guān)股東和合作伙伴也被市場(chǎng)挖掘出來炒作。AI大模型領(lǐng)域近年來吸引了大量資本投入，盡管性能上取得了突破，但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn)。大模型訓(xùn)練需要巨額算力支持，當(dāng)前市場(chǎng)中算力資源的過剩使得成本問題凸顯。國(guó)際競(jìng)爭(zhēng)與政策影響進(jìn)一步加劇了AI產(chǎn)業(yè)鏈的不確定性。AI應(yīng)用后期的投資機(jī)會(huì)廣泛且多樣，從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用，再到生成式AI和端側(cè)AI，均展現(xiàn)出強(qiáng)勁的增長(zhǎng)潛力。

1月25日，AMD宣布全新的DeepSeek-V3模型已集成至其Instinct GPU上。DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本，使AMD GPU成為比英偉達(dá)更具成本效益的替代品。這一消息導(dǎo)致國(guó)內(nèi)A股市場(chǎng)算力硬件股持續(xù)走低，銅高速連接、CPO等方向領(lǐng)跌，仕佳光子跌超16%，兆龍互連、天孚通信等跌超10%。

OpenAI的成功在于規(guī)模制勝，但這種模式帶來了高昂的訓(xùn)練成本，不少公司難以承受。臉書母公司Meta成立了四個(gè)專門研究小組來研究量化巨頭幻方量化旗下的國(guó)產(chǎn)大模型DeepSeek的工作原理，并基于此改進(jìn)旗下大模型Llama。

黑崎資本首席戰(zhàn)略官陳興文指出，DeepSeek的低成本意味著未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力，而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè)，這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過MIT協(xié)議開源8個(gè)核心模型并全鏈路公開訓(xùn)練細(xì)節(jié)，打破了閉源體系的技術(shù)壟斷，通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯。

DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略，結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破，成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局，催生產(chǎn)業(yè)鏈價(jià)值重構(gòu)。在算力基建層面，數(shù)據(jù)中心向綠色高效轉(zhuǎn)型，特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源，驅(qū)動(dòng)數(shù)據(jù)采集、清洗、標(biāo)注產(chǎn)業(yè)升級(jí)。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài)：開源模型大幅降低技術(shù)準(zhǔn)入門檻，使得中小企業(yè)能快速部署輕量化應(yīng)用，加速AI能力向物聯(lián)網(wǎng)終端滲透。

當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國(guó)市場(chǎng)中，大量跨界資本涌入智算中心建設(shè)，導(dǎo)致2024年全國(guó)建成超1.3萬個(gè)智算中心，但平均利用率不足30%，千卡集群年虧損達(dá)2700萬元。這種過剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果。實(shí)際需求端，大模型訓(xùn)練所需的智能算力缺口達(dá)53%，技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期，設(shè)備貶值率超40%。

DeepSeek僅用2048塊H800顯卡、557萬美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型，通過MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制，將訓(xùn)練效率提升至Meta Llama3的11倍，百萬Token推理成本壓至0.55美元（僅為OpenAI的3.6%）。這種“算法優(yōu)化對(duì)沖硬件約束”的模式，不僅證明尖端AI發(fā)展無需依賴無限堆砌算力，更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基。

DeepSeek的崛起被稱為“美股最大威脅”，源于其對(duì)美國(guó)AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu)。技術(shù)層面，其開源策略形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”，吸引Meta、Google工程師反向研究其RL技術(shù)框架。產(chǎn)業(yè)層面，其通過算法創(chuàng)新削弱了英偉達(dá)高端GPU的不可替代性，引發(fā)英偉達(dá)股價(jià)單日暴跌5.8%，連帶日本芯片測(cè)試設(shè)備商Advantest市值蒸發(fā)8.6%。地緣博弈層面，DeepSeek驗(yàn)證了中國(guó)AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性，紐約時(shí)報(bào)評(píng)價(jià)其“使美國(guó)芯片封鎖淪為戰(zhàn)略敗筆”。

這場(chǎng)變革的本質(zhì)是AI競(jìng)爭(zhēng)從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過剩實(shí)則是低端產(chǎn)能出清的前奏，DeepSeek的技術(shù)路徑預(yù)示未來算力市場(chǎng)將兩極分化：通用算力加速淘汰，智能算力向算法優(yōu)勢(shì)企業(yè)集中。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek帶飛國(guó)內(nèi)AI大模型概念股 低成本訓(xùn)練引關(guān)注

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek帶飛國(guó)內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注