在過去一周的開源周上,DeepSeek連續(xù)五天發(fā)布重磅消息,令市場贊嘆不已。就在外界以為這場盛宴即將結(jié)束時,DeepSeek又帶來了一個令人震驚的消息:其V3/R1推理系統(tǒng)理論日利潤高達346萬元人民幣,成本利潤率高達545%。
市場的超高“暴利”引發(fā)了廣泛關(guān)注,人們開始討論如何解讀這個利潤率,以及這對算力、云產(chǎn)業(yè)鏈、大模型同行和生態(tài)意味著什么??萍疾┲鱾儗Υ颂岢隽烁髯缘目捶?。
目前公布的545%利潤率是基于特定條件下的理論計算,實際利潤率要低得多。根據(jù)DeepSeek官方的說法,R1模型的利潤率約為85%,而按照V3的定價,利潤率會降至70%左右。即便如此,這個數(shù)字仍然非??捎^。對比Anthropic 2024年的預(yù)期利潤率61%,可以看出盡管OpenAI和Anthropic在成本控制上可能不如DeepSeek極致,但它們憑借更高的定價和更慷慨的客戶也能實現(xiàn)類似的高利潤率。
DeepSeek的案例證明,即使在硬件條件相對有限的情況下(使用H800),通過極致的infra優(yōu)化,也能實現(xiàn)極高的算力利用率和性能。這意味著有效算力的重要性將凸顯,行業(yè)將更加關(guān)注算力利用率,而不僅僅是單純的算力堆砌。此外,國產(chǎn)芯片的上限也有望提升。一些科技博主認(rèn)為,算力效率的提升并不會減少算力需求,反而會刺激更多應(yīng)用場景的出現(xiàn),推動算力需求持續(xù)增長。但也有人認(rèn)為,DeepSeek已經(jīng)將英偉達“擊倒”,全球的AI需求并沒有那么高。
DeepSeek的成功案例讓AI云計算與傳統(tǒng)云計算的相似性更加明顯,兩者都面臨低峰期閑置率和高峰期穩(wěn)定性的挑戰(zhàn)。大規(guī)模集群和高并發(fā)利用率能顯著降低成本,用戶數(shù)量越多,平抑波動的能力越強,算力冗余需求越低。擁有自身業(yè)務(wù)的云廠商可能比沒有自身業(yè)務(wù)的云廠商更具成本優(yōu)勢。此外,私有云部署的吸引力可能下降,普通云計算/AI應(yīng)用需要為高強度用戶并發(fā)預(yù)留更多空間。
過去一周,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷