DeepSeek帶飛國內(nèi)AI大模型概念股低成本訓練引關(guān)注(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 07:28:24 每日經(jīng)濟新聞

黑崎資本首席戰(zhàn)略官陳興文指出，DeepSeek的低成本意味著未來對推理算力的需求將成為主要驅(qū)動力，而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側(cè)，這可能對其市場地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過MIT協(xié)議開源8個核心模型并全鏈路公開訓練細節(jié)，打破了閉源體系的技術(shù)壟斷，通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競賽”邏輯。

DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略，結(jié)合強化學習替代監(jiān)督微調(diào)的技術(shù)突破，成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動力。這種逆境突圍重新定義了全球AI競爭格局，催生產(chǎn)業(yè)鏈價值重構(gòu)。在算力基建層面，數(shù)據(jù)中心向綠色高效轉(zhuǎn)型，特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源，驅(qū)動數(shù)據(jù)采集、清洗、標注產(chǎn)業(yè)升級。更深遠的影響體現(xiàn)在AI應用生態(tài)：開源模型大幅降低技術(shù)準入門檻，使得中小企業(yè)能快速部署輕量化應用，加速AI能力向物聯(lián)網(wǎng)終端滲透。

當前全球算力市場正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國市場中，大量跨界資本涌入智算中心建設(shè)，導致2024年全國建成超1.3萬個智算中心，但平均利用率不足30%，千卡集群年虧損達2700萬元。這種過剩本質(zhì)上是低端算力的盲目擴張與高端智能算力短缺的疊加結(jié)果。實際需求端，大模型訓練所需的智能算力缺口達53%，技術(shù)迭代速度遠超硬件建設(shè)周期，設(shè)備貶值率超40%。

DeepSeek僅用2048塊H800顯卡、557萬美元成本便訓練出性能對標GPT-4的模型，通過MLA架構(gòu)和強化學習飛輪機制，將訓練效率提升至Meta Llama3的11倍，百萬Token推理成本壓至0.55美元（僅為OpenAI的3.6%）。這種“算法優(yōu)化對沖硬件約束”的模式，不僅證明尖端AI發(fā)展無需依賴無限堆砌算力，更動搖了美國技術(shù)霸權(quán)的根基。

關(guān)閉

DeepSeek帶飛國內(nèi)AI大模型概念股 低成本訓練引關(guān)注(2)

相關(guān)新聞

今日熱點

頻道熱點

DeepSeek帶飛國內(nèi)AI大模型概念股低成本訓練引關(guān)注(2)