DeepSeek引發(fā)的蝴蝶效應(yīng)仍在持續(xù)。1月20日,DeepSeek公司發(fā)布了其推理模型DeepSeek-R1的完整版本。該模型通過算法優(yōu)化,以較低的訓(xùn)練成本實現(xiàn)了與OpenAI的o1模型相媲美的性能,并且開源。
傳統(tǒng)AI訓(xùn)練對算力的需求巨大,而DeepSeek開辟了一條新路徑,吸引了眾多企業(yè)爭相接入。據(jù)統(tǒng)計,已有超過100家國內(nèi)上市公司接入了DeepSeek-R1模型,其中包括阿里、騰訊、百度和三大運(yùn)營商等擁有自研模型和AI應(yīng)用的企業(yè)。
業(yè)內(nèi)人士指出,企業(yè)選擇DeepSeek的原因主要有兩點:一是DeepSeek-R1開源徹底,部署方便,在特定場景下表現(xiàn)出強(qiáng)大的處理和推理能力;二是DeepSeek聲量走高,意味著接入方有機(jī)會承接其外溢的流量。數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)在2月1日突破3000萬大關(guān)。
然而,接入DeepSeek模型也可能面臨巨大的虧損壓力。據(jù)潞晨科技CEO尤洋測算,如果每日輸出1000億token,一個月算下來接入方企業(yè)可獲得4800萬元收入,但完成這一輸出需要約4000臺搭載H800的機(jī)器,每月僅機(jī)器成本就達(dá)4.5億元,因此企業(yè)可能面臨每月4億元的虧損。另一名市場負(fù)責(zé)人表示,目前公司對外合作項目還未落地,具體成本數(shù)據(jù)暫不清晰。
在AI的潮汐效應(yīng)下,接入DeepSeek是否一本萬利,還需進(jìn)一步觀察。
企業(yè)接入DeepSeek的程度有所不同。例如,騰訊近乎全面擁抱DeepSeek,將微信、騰訊文檔、QQ瀏覽器等業(yè)務(wù)側(cè)產(chǎn)品先后接入DeepSeek-R1,并推出支持混元大模型和DeepSeek-R1切換使用的“騰訊元寶”。相比之下,阿里等公司在主營業(yè)務(wù)側(cè)產(chǎn)品上接入了DeepSeek,但仍保留了自研大模型產(chǎn)品的空間。
值得買科技CTO王云峰認(rèn)為,接入模型并非數(shù)量上的比拼,需求方應(yīng)充分考慮模型與業(yè)務(wù)場景的適配性。他提到,值得買科技自研了130億參數(shù)消費(fèi)大模型,也接入了一些主流模型。DeepSeek-R1在生成內(nèi)容的行文邏輯和文學(xué)性方面表現(xiàn)突出,提升了公司內(nèi)容生產(chǎn)的效率。