今日A股市場(chǎng)迎來龍年收官戰(zhàn),三大指數(shù)走勢(shì)分化明顯。收盤時(shí),滬指跌0.06%,創(chuàng)業(yè)板指跌2.73%,收?qǐng)?bào)2063.82點(diǎn)。滬深兩市成交額達(dá)到11179億元,較上周五縮量1041億。
值得注意的是,DeepSeek概念股領(lǐng)漲,AI智能體、AI語料等概念股表現(xiàn)強(qiáng)勁。與此同時(shí),算力板塊的銅高速連接、CPO等方向則紛紛領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
上述現(xiàn)象主要源于國(guó)產(chǎn)大模型DeepSeek在美區(qū)App Store免費(fèi)榜登頂,并在國(guó)內(nèi)App Store免費(fèi)榜同樣位居第一。DeepSeek和ChatGPT躋身美區(qū)App Store免費(fèi)榜前三,展現(xiàn)出中國(guó)應(yīng)用程序的影響力。DeepSeek推理大模型DeepSeek-R1發(fā)布已近一周,開源模型DeepSeek-V3也已發(fā)布近一個(gè)月。DeepSeek-V3僅用2048塊H800 GPU完成6710億參數(shù)模型訓(xùn)練,成本僅為557.6萬美元,遠(yuǎn)低于其他頂級(jí)模型如GPT-4的10億美元。
受此利好影響,國(guó)內(nèi)DeepSeek概念股受到追捧,相關(guān)股東和合作伙伴也被市場(chǎng)挖掘出來炒作。AI大模型領(lǐng)域近年來吸引了大量資本投入,盡管性能上取得了突破,但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn)。大模型訓(xùn)練需要巨額算力支持,當(dāng)前市場(chǎng)中算力資源的過剩使得成本問題凸顯。國(guó)際競(jìng)爭(zhēng)與政策影響進(jìn)一步加劇了AI產(chǎn)業(yè)鏈的不確定性。AI應(yīng)用后期的投資機(jī)會(huì)廣泛且多樣,從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,再到生成式AI和端側(cè)AI,均展現(xiàn)出強(qiáng)勁的增長(zhǎng)潛力。
1月25日,AMD宣布全新的DeepSeek-V3模型已集成至其Instinct GPU上。DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比英偉達(dá)更具成本效益的替代品。這一消息導(dǎo)致國(guó)內(nèi)A股市場(chǎng)算力硬件股持續(xù)走低,銅高速連接、CPO等方向領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
OpenAI的成功在于規(guī)模制勝,但這種模式帶來了高昂的訓(xùn)練成本,不少公司難以承受。臉書母公司Meta成立了四個(gè)專門研究小組來研究量化巨頭幻方量化旗下的國(guó)產(chǎn)大模型DeepSeek的工作原理,并基于此改進(jìn)旗下大模型Llama。
黑崎資本首席戰(zhàn)略官陳興文指出,DeepSeek的低成本意味著未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力,而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過MIT協(xié)議開源8個(gè)核心模型并全鏈路公開訓(xùn)練細(xì)節(jié),打破了閉源體系的技術(shù)壟斷,通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯。
DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,催生產(chǎn)業(yè)鏈價(jià)值重構(gòu)。在算力基建層面,數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源,驅(qū)動(dòng)數(shù)據(jù)采集、清洗、標(biāo)注產(chǎn)業(yè)升級(jí)。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài):開源模型大幅降低技術(shù)準(zhǔn)入門檻,使得中小企業(yè)能快速部署輕量化應(yīng)用,加速AI能力向物聯(lián)網(wǎng)終端滲透。
當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國(guó)市場(chǎng)中,大量跨界資本涌入智算中心建設(shè),導(dǎo)致2024年全國(guó)建成超1.3萬個(gè)智算中心,但平均利用率不足30%,千卡集群年虧損達(dá)2700萬元。這種過剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果。實(shí)際需求端,大模型訓(xùn)練所需的智能算力缺口達(dá)53%,技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,設(shè)備貶值率超40%。
DeepSeek僅用2048塊H800顯卡、557萬美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型,通過MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,將訓(xùn)練效率提升至Meta Llama3的11倍,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對(duì)沖硬件約束”的模式,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基。
DeepSeek的崛起被稱為“美股最大威脅”,源于其對(duì)美國(guó)AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu)。技術(shù)層面,其開源策略形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”,吸引Meta、Google工程師反向研究其RL技術(shù)框架。產(chǎn)業(yè)層面,其通過算法創(chuàng)新削弱了英偉達(dá)高端GPU的不可替代性,引發(fā)英偉達(dá)股價(jià)單日暴跌5.8%,連帶日本芯片測(cè)試設(shè)備商Advantest市值蒸發(fā)8.6%。地緣博弈層面,DeepSeek驗(yàn)證了中國(guó)AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性,紐約時(shí)報(bào)評(píng)價(jià)其“使美國(guó)芯片封鎖淪為戰(zhàn)略敗筆”。
這場(chǎng)變革的本質(zhì)是AI競(jìng)爭(zhēng)從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過剩實(shí)則是低端產(chǎn)能出清的前奏,DeepSeek的技術(shù)路徑預(yù)示未來算力市場(chǎng)將兩極分化:通用算力加速淘汰,智能算力向算法優(yōu)勢(shì)企業(yè)集中。
中國(guó)AI大模型市場(chǎng)規(guī)模正在快速發(fā)展。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動(dòng)科技界