DeepSeek創(chuàng)始人梁文鋒迅速在AI圈內(nèi)確立地位。梁文鋒本碩均就讀于浙江大學信息與電子工程學專業(yè)。2015年,他與校友共同創(chuàng)立幻方量化。2021年,幻方量化成為國內(nèi)首家突破千億規(guī)模的量化私募大廠,被稱為國內(nèi)量化私募“四大天王”之一。早年,幻方量化開始大規(guī)模布局AI算力,搭建起“螢火一號”集群。2021年,“螢火二號”落成,為DeepSeek提供了快速發(fā)展的基礎(chǔ)。
DeepSeek團隊在預(yù)訓練方面貢獻巨大,包括超強的訓練穩(wěn)定度、深入使用fb8混合精度、多詞同時預(yù)測、隱空間多注意力頭、MOE混合專家等,大大降低了訓練成本。他們僅用600萬美元就訓練出了一個600B的大模型,被視作工程上的奇跡。
分析人士指出,DeepSeek用較低的成本訓練出比肩OpenAI o1水平的模型R1,而且R1還開源,這意味著算法有很大的提升空間,不需要那么多GPU和算力。封鎖芯片和搞算力壁壘的思路行不通,而依賴大量GPU堆砌效果的模式也受到挑戰(zhàn)。DeepSeek的出現(xiàn)可能導致許多購買了數(shù)千塊NVIDIA芯片的AI初創(chuàng)公司破產(chǎn),從而導致大量NVIDIA GPU流入二手市場。此外,一些運營數(shù)據(jù)中心并出租NVIDIA GPU的初創(chuàng)公司也可能受到影響。
這可能刺激更多專用推理模型誕生,創(chuàng)業(yè)公司和個人App可能會大幅減少在OpenAI API上的支出,轉(zhuǎn)向開源。評論人士稱,DeepSeek整合搜索信息的能力強于某些現(xiàn)有模型,讓人對英偉達股價產(chǎn)生懷疑。中美科技底層差距雖然大,但中國擁有巨大的人才紅利,有超過6000萬工程師,超過美德日韓印總和,這是繼續(xù)發(fā)展的底氣和希望。
消息人士稱,索尼早在數(shù)年前便啟動了下一代游戲主機PS6的芯片招標程序,博通等公司被淘汰后,英特爾與AMD是最后兩位入圍決賽圈的選手。
2024-09-18 13:43:03AMD擊敗Intel獲PS6芯片合同