黑崎資本首席戰(zhàn)略官陳興文指出,DeepSeek的低成本意味著未來對推理算力的需求將成為主要驅(qū)動力,而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側(cè),這可能對其市場地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過MIT協(xié)議開源8個核心模型并全鏈路公開訓練細節(jié),打破了閉源體系的技術(shù)壟斷,通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競賽”邏輯。
DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結(jié)合強化學習替代監(jiān)督微調(diào)的技術(shù)突破,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動力。這種逆境突圍重新定義了全球AI競爭格局,催生產(chǎn)業(yè)鏈價值重構(gòu)。在算力基建層面,數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源,驅(qū)動數(shù)據(jù)采集、清洗、標注產(chǎn)業(yè)升級。更深遠的影響體現(xiàn)在AI應用生態(tài):開源模型大幅降低技術(shù)準入門檻,使得中小企業(yè)能快速部署輕量化應用,加速AI能力向物聯(lián)網(wǎng)終端滲透。
當前全球算力市場正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國市場中,大量跨界資本涌入智算中心建設(shè),導致2024年全國建成超1.3萬個智算中心,但平均利用率不足30%,千卡集群年虧損達2700萬元。這種過剩本質(zhì)上是低端算力的盲目擴張與高端智能算力短缺的疊加結(jié)果。實際需求端,大模型訓練所需的智能算力缺口達53%,技術(shù)迭代速度遠超硬件建設(shè)周期,設(shè)備貶值率超40%。
DeepSeek僅用2048塊H800顯卡、557萬美元成本便訓練出性能對標GPT-4的模型,通過MLA架構(gòu)和強化學習飛輪機制,將訓練效率提升至Meta Llama3的11倍,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對沖硬件約束”的模式,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,更動搖了美國技術(shù)霸權(quán)的根基。
數(shù)據(jù)是寶貴的資源,能夠幫助投資者減少煩惱。中國AI大模型市場正快速發(fā)展。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光在ChatGPT掀起全球AI熱潮兩年后,大模型領(lǐng)域迎來了一位新星——DeepSeek。憑借高性能、低成本以及完全開源的特點,DeepSeek迅速吸引了公眾的目光,成為市場上的“鯰魚”
2025-02-14 17:24:33從DeepSeek看AI趨勢中國AI大模型市場規(guī)模正在快速發(fā)展。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動科技界在華為全聯(lián)接大會期間,即9月19日至21日,華為與科大訊飛的合作進一步升級,雙方在通用大模型底座的構(gòu)建及應用落地方面展現(xiàn)出顯著進展
2024-09-24 09:47:04華為科大訊飛深化大模型合作