近年來,各大科技巨頭之間的大模型比拼都是算力戰(zhàn),動(dòng)輒上百億美元的芯片資本支出,最頂級(jí)的芯片不僅供不應(yīng)求還限制出口,這讓擁有雄厚財(cái)力的硅谷科技巨頭占盡優(yōu)勢(shì)。然而,DeepSeek以極低成本芯片訓(xùn)練出突破性模型,讓這一切開始動(dòng)搖。據(jù)新智元報(bào)道,UC伯克利博士生潘家怡和另兩位研究人員在CountDown游戲中復(fù)現(xiàn)了DeepSeek R1-Zero,通過強(qiáng)化學(xué)習(xí)RL,3B的基礎(chǔ)語言模型也能夠自我驗(yàn)證和搜索,成本不到30美元,結(jié)果相當(dāng)出色。港科大助理教授何俊賢的團(tuán)隊(duì)僅用8K個(gè)樣本就在7B模型上復(fù)刻出了DeepSeek-R1-Zero和DeepSeek-R1的訓(xùn)練,模型在復(fù)雜的數(shù)學(xué)推理上取得了強(qiáng)勁結(jié)果。全球最大開源平臺(tái)HuggingFace團(tuán)隊(duì)也宣布復(fù)刻DeepSeek R1所有pipeline,完成后所有訓(xùn)練數(shù)據(jù)和腳本將全部開源。
展望未來,DeepSeek R1的問世通過“極致壓縮+高效強(qiáng)化訓(xùn)練+AI推理算力大幅簡(jiǎn)化”的低成本新模式,宣告屬于AI ASIC的時(shí)代已經(jīng)到來。ASIC憑借其算力、能效和定制化優(yōu)勢(shì),正成為AI基礎(chǔ)設(shè)施的“新基建”,推動(dòng)大模型、自動(dòng)駕駛、智能終端等領(lǐng)域的突破。未來,隨著Chiplet、先進(jìn)封裝等技術(shù)的成熟,ASIC將進(jìn)一步降低成本,成為AI普惠化的核心引擎。
2月5日,節(jié)后首個(gè)交易日,DeepSeek概念股開盤后全線大漲。截至午間收盤,并行科技、安凱微、安恒信息、每日互動(dòng)、夢(mèng)網(wǎng)科技、三六零等股票漲停
2025-02-05 21:50:59DeepSeek概念成蛇年首個(gè)交易日亮點(diǎn)