最新！美國(guó)專家批駁國(guó)會(huì)DeepSeek報(bào)告(5)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-04-30 08:05:57 騰訊

第三，

雖然存在關(guān)于DeepSeek在訓(xùn)練過(guò)程中使用了更先進(jìn)的美國(guó)模型輸出進(jìn)行蒸餾的指控，但目前沒(méi)有任何確鑿證據(jù)證實(shí)此事，蒸餾在DeepSeek V3和R1模型訓(xùn)練中究竟扮演了多重要的角色也尚不明確。

從DeepSeek公開(kāi)發(fā)布的論文來(lái)看，其所詳細(xì)描述的創(chuàng)新方法，在解釋模型性能時(shí)顯然起到了更關(guān)鍵的作用。

第四，正如我之前詳細(xì)說(shuō)明過(guò)的，

DeepSeek用于訓(xùn)練其模型的先進(jìn)GPU，都是在美國(guó)出口管制尚未限制對(duì)華出口的時(shí)期合法獲得的。

市面上流傳的一些說(shuō)法，稱DeepSeek掌握了一個(gè)包含5萬(wàn)顆H100GPU的大型集群，但根據(jù)與眾多行業(yè)內(nèi)部人士及了解中國(guó)高端GPU供應(yīng)情況的人的交流，這種說(shuō)法已經(jīng)被證實(shí)是沒(méi)有依據(jù)的。此外，DeepSeek將其模型開(kāi)源，并在研究論文中詳細(xì)披露了訓(xùn)練和優(yōu)化方法，這些都清晰表明：DeepSeek的優(yōu)化策略是專門(mén)為了克服其可用硬件資源的限制而設(shè)計(jì)的，包括一批A100GPU和少量H800GPU——而這些硬件都是在H800也被列入出口管制清單之前獲得的。無(wú)論如何，很明顯，DeepSeek會(huì)繼續(xù)利用現(xiàn)有的英偉達(dá)GPU資源，同時(shí)也在尋求使用國(guó)產(chǎn)AI硬件開(kāi)發(fā)下一代模型，特別是來(lái)自華為的硬件，比如目前已經(jīng)部署在CloudMatrix384集群中、并在國(guó)內(nèi)市場(chǎng)銷(xiāo)售的昇騰910C芯片。未來(lái)，DeepSeek還可能利用華為硬件和云服務(wù)的進(jìn)一步升級(jí)，比如傳聞中的昇騰910D以及昇騰920系列處理器。

關(guān)于所謂“中國(guó)軍方和政府資助DeepSeek研究”的報(bào)告，其實(shí)相當(dāng)牽強(qiáng)。

大約在《DeepSeek揭秘》報(bào)告發(fā)布的同時(shí)，咨詢公司Exiger也發(fā)布了一份關(guān)于DeepSeek的報(bào)告，這類“研究”在近期針對(duì)中國(guó)企業(yè)的報(bào)道中很常見(jiàn)。這份報(bào)告充滿了將關(guān)系錯(cuò)誤歸因、無(wú)端指控DeepSeek存在“欺騙”行為的低級(jí)錯(cuò)誤。報(bào)告標(biāo)題為《DeepSeek的欺騙：中國(guó)軍方和政府如何資助DeepSeek的AI研究》，但這一標(biāo)題完全不準(zhǔn)確，因?yàn)镈eepSeek的研發(fā)資金完全來(lái)自其母公司幻方資本（High Flyer Capital）的投資，這一事實(shí)有清晰的文件記錄支持。

首頁(yè)上一頁(yè)...2 3 456 7 8...全文共 9 頁(yè)下一頁(yè)

關(guān)閉

最新！美國(guó)專家批駁國(guó)會(huì)DeepSeek報(bào)告(5)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

最新！美國(guó)專家批駁國(guó)會(huì)DeepSeek報(bào)告(5)