DeepSeek開源第三日行業(yè)影響幾何加速AI計算生態(tài)構建

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-02-26 21:35:35 第一財經

2月26日，在開源周第三天，DeepSeek宣布開放高效的FP8 GEMM庫DeepGEMM。這三天的發(fā)布內容都與算法相關，偏向技術層面。大模型生態(tài)社區(qū)OpenCSG創(chuàng)始人陳冉舉例說，以前DeepSeek直接提供一個產品并說明其性能，現(xiàn)在則深入探討實現(xiàn)高性能的具體方法和框架。這些“腳手架”的開源有助于后續(xù)生態(tài)建設。

此次發(fā)布的關鍵詞是GEMM（通用矩陣乘法），這是一種線性代數(shù)中的基本運算。FP8 GEMM是一種使用8位浮點數(shù)進行矩陣乘法的操作，適用于深度學習和高性能計算，能在保持高效率的同時減少內存占用和帶寬需求。據(jù)DeepSeek介紹，DeepGEMM支持傳統(tǒng)稠密模型和MoE（混合專家）模型的GEMM運算，為基于英偉達Hopper架構（如H100 GPU）的V3/R1系列硬件提供高效訓練和推理支持。

在英偉達Hopper架構的GPU上，DeepGEMM可實現(xiàn)超過1350 FP8 TFLOPS的性能，充分利用了算力。該代碼庫設計簡潔，只有一個核心內核函數(shù)，約300行代碼，但在大多數(shù)矩陣規(guī)模上優(yōu)于專家調優(yōu)的內核。DeepGEMM通過FP8和硬件級優(yōu)化解決了大模型計算效率和資源消耗問題，尤其是對MoE模型的支持。開源行為加速了技術民主化，可能成為AI計算生態(tài)的基礎設施，推動行業(yè)向更高效、低成本的方向發(fā)展。

FP8作為AI計算的新興標準，可以加速千億參數(shù)模型的訓練，降低顯存需求。在邊緣設備或云端部署時，F(xiàn)P8的低精度計算能顯著提升吞吐量，降低成本。因此，開源DeepGEMM有助于推動FP8生態(tài)普及，降低開發(fā)者使用門檻，促進更多框架和模型適配FP8，加速行業(yè)向低精度計算遷移。此外，DeepGEMM的開源還提供了高效實現(xiàn)MoE模型的參考，可能催生更多應用，如多模態(tài)模型和邊緣端高效模型。

對于DeepSeek連續(xù)三天的代碼庫開源，陳冉表示非常震撼。他認為DeepSeek的目標是展示R1和V3的技術細節(jié)，發(fā)布的算法某種意義上屬于“腳手架”，必須給開發(fā)者提供這些基礎工具，才能讓整個行業(yè)在此基礎上繼續(xù)發(fā)展。長期來看，這一開源動作非常有意義，既有模型標準，也有工具標準，還有生態(tài)基石，這樣才能使生態(tài)成長起來。

陳冉認為，DeepSeek的代碼開源可能會影響一批從事AI基礎設施層的人士。盡管DeepSeek已經公開了大部分技術棧和模型，但數(shù)據(jù)部分仍需復現(xiàn)。這種開源是一把雙刃劍，如果能用好可能會帶來好處，否則可能受到沖擊。有從業(yè)者表示，雖然DeepSeek開源的是推理加速部分，對從業(yè)者的實際影響或許不會太大，但其對行業(yè)的影響才剛剛開始，未來走向難以預測。

DeepSeek此前宣布會陸續(xù)開源五個代碼庫，接下來還將發(fā)布兩個代碼庫。每分享一行代碼，都將為加速AI行業(yè)發(fā)展貢獻力量。

(責任編輯：張佳鑫 0764)

關閉

DeepSeek開源第三日 行業(yè)影響幾何 加速AI計算生態(tài)構建

相關新聞

今日熱點

頻道熱點

DeepSeek開源第三日行業(yè)影響幾何加速AI計算生態(tài)構建