DeepSeek如何以顛覆性訓練策略重構大型參數(shù)模型的成本公式?1月底,美國知名半導體咨詢機構SemiAnalysis發(fā)布了一篇關于“給Deepseek算經(jīng)濟賬”的文章,引起了廣泛關注。近日,心智觀察所與SemiAnalysis的總裁Dylan Patel、資深分析師AJ Kourabi和David Wolfson就全球LLM模型競爭生態(tài)、穿透算力軍備競賽表象以及大模型博弈中數(shù)據(jù)、算法、資本的三重角力等問題進行了深入討論。
心智觀察所提到,SemiAnalysis早在去年五月就發(fā)現(xiàn)了DeepSeek在MoE、RoPE、Attention等領域的創(chuàng)新貢獻。SemiAnalysis表示,他們一直密切關注AI領域的創(chuàng)新和進展,對DeepSeek取得的進步印象深刻。大多數(shù)領先的AI實驗室并沒有忽視DeepSeek——Anthropic的CEO公開表示,他們從V2甚至更早的時候就開始跟蹤DeepSeek的發(fā)展。大多數(shù)實驗室都預計到了從V2到V3會有這種程度的改進,除了Meta。
心智觀察所詢問了TCO模型(總計算成本)的搭建情況。SemiAnalysis回應稱,他們開發(fā)了自己獨有的解決方案,并與多家公司合作,提供咨詢服務以支持他們的集群建設。
對于Meta AI是否可能對Google搜索造成沖擊的問題,SemiAnalysis認為,Meta擁有直接接觸數(shù)十億日活躍用戶的能力,使他們能夠立即將大量用戶群體調(diào)用于他們引入的任何AI功能。
關于未來DeepSeek的競爭態(tài)勢,SemiAnalysis預計OpenAI憑借其在人才、基礎設施和資本方面的卓越資源,將保持領先地位。DeepSeek正在利用一種新范式,通過瞄準低垂果實實現(xiàn)快速且成本效益高的進展。然而,隨著格局的演變,保持這種勢頭將變得越來越具有挑戰(zhàn)性。同樣,他們也預計Google將保持領先地位。Anthropic擁有顯著優(yōu)于DeepSeek的模型,預計將在不久的將來公開發(fā)布。Meta處于更具挑戰(zhàn)性的位置,因為他們是唯一一個致力于開源其模型的主要實驗室。據(jù)SemiAnalysis了解,Meta正在開發(fā)一個新模型,預計其性能將超過DeepSeek,但改進的程度是否足以證明推遲發(fā)布是合理的,這一點仍不確定。
美國人工智能公司OpenAI向其快速崛起的中國競爭對手DeepSeek發(fā)起了進攻。13日,OpenAI向美國政府提交了一份長達15頁的信函,稱DeepSeek的最新模型R1是一個值得關注的進展
2025-03-15 14:35:01OpenAI寫信攻擊DeepSeek