3月1日,DeepSeek在開源周最后一天發(fā)布的數(shù)據(jù)引發(fā)了廣泛關(guān)注。數(shù)據(jù)顯示,V3/R1推理系統(tǒng)理論日利潤高達(dá)346萬元人民幣(47.5萬美元)。這一數(shù)字背后反映了AI模型服務(wù)商業(yè)化的問題。盡管有人認(rèn)為即便按照更嚴(yán)格的計算標(biāo)準(zhǔn),DeepSeek仍然能夠盈利,但關(guān)于API銷售商能否賺錢,業(yè)內(nèi)存在爭議。
DeepSeek統(tǒng)計了2月27日至2月28日的24小時內(nèi),V3和R1推理服務(wù)占用節(jié)點總數(shù),峰值為278個節(jié)點,平均值為226.75個節(jié)點(每個節(jié)點包含8個H800 GPU)。假設(shè)GPU租賃成本為每小時2美元,每日總成本約為8.7萬美元(折合人民幣約63萬元)。
如果所有token都以DeepSeek-R1的價格計費,每日總收入將達(dá)到56.2萬美元(折合人民幣約409萬元),成本利潤率可達(dá)545%。然而,實際收入遠(yuǎn)低于這一理論數(shù)值,因為V3定價較低且收費服務(wù)僅占一部分,網(wǎng)頁端和應(yīng)用程序免費,并且夜間還有折扣。
根據(jù)官方公布的理論數(shù)據(jù),每日收入56.2萬美元減去GPU成本8.7萬美元,理論上最高每天可盈利47.5萬美元(折合人民幣約346萬元)。DeepSeek創(chuàng)始人梁文鋒曾表示,公司的原則是不虧本也不追求暴利,價格設(shè)定在成本之上略有利潤。當(dāng)時,DeepSeek降低API價格引發(fā)了行業(yè)內(nèi)的價格戰(zhàn)。
DeepSeek能夠?qū)崿F(xiàn)高利潤率,部分原因在于團(tuán)隊將優(yōu)化做到了極致,實現(xiàn)了對GPU的最大限度利用。為了達(dá)到更大吞吐量和更低延遲的目標(biāo),DeepSeek采用了大規(guī)??绻?jié)點專家并行技術(shù),每個GPU只需計算少量專家,從而減少延遲需求。
最近一周,DeepSeek不僅在國外平臺發(fā)布了相關(guān)信息,還在國內(nèi)知乎平臺上發(fā)布了推理系統(tǒng)的詳細(xì)概覽。硅基流動創(chuàng)始人袁進(jìn)輝評論稱,DeepSeek披露的成本和收益再次顛覆了許多人的認(rèn)知。他指出,許多供應(yīng)商無法達(dá)到這一水平,主要是由于V3/R1架構(gòu)與其他主流模型差異較大,導(dǎo)致現(xiàn)有系統(tǒng)不再有效,必須按DeepSeek的方法才能達(dá)到最佳效率。DeepSeek已將主要模塊開源,降低了社區(qū)復(fù)現(xiàn)難度。