4月18日,杭州知名科技企業(yè)DeepSeek計(jì)劃進(jìn)行首次外部融資的消息在市場(chǎng)上流傳。據(jù)報(bào)道,DeepSeek的目標(biāo)估值不低于100億美元,擬籌集至少3億美元資金,約合20.5億元人民幣。若交易達(dá)成,這將是DeepSeek首次引入外部資本。
2025年,DeepSeek創(chuàng)始人梁文鋒曾多次拒絕外部融資。例如在2025年3月,騰訊和阿里巴巴等科技公司希望與DeepSeek探討潛在的合作機(jī)會(huì),但梁文鋒表示“現(xiàn)在并不急于融資”,擔(dān)心外部投資者會(huì)干預(yù)公司決策。值得注意的是,市場(chǎng)對(duì)這一消息的關(guān)注焦點(diǎn)主要在于,DeepSeek背靠的是幻方量化這一資金實(shí)力雄厚的母公司,這也可能是梁文鋒此前多次拒絕外部融資的原因之一。然而,公司最終還是選擇了邁出商業(yè)化的一步。
DeepSeek由量化私募巨頭幻方量化孵化,梁文鋒同時(shí)執(zhí)掌這兩家橫跨金融與AI賽道的企業(yè)。據(jù)私募排排網(wǎng)最新數(shù)據(jù),幻方量化2025年的收益均值達(dá)56.55%,在中國(guó)管理規(guī)模超百億的量化私募業(yè)績(jī)榜中位列第二。該公司近三年的收益均值為85.15%,近五年的收益均值為114.35%。目前,幻方量化管理的資產(chǎn)規(guī)模已超過(guò)700億元。
從技術(shù)迭代進(jìn)展來(lái)看,DeepSeek下一步將推出全新多模態(tài)大模型V4。公開(kāi)資料顯示,DeepSeek V4原生支持圖片、視頻與文本生成功能,是該公司自2025年1月推出R1推理模型以來(lái)的首個(gè)重大版本更新。目前,DeepSeek V4已完成與華為、寒武紀(jì)等國(guó)內(nèi)頭部AI芯片廠商的深度優(yōu)化適配,適配工作圍繞算力調(diào)度、推理效率優(yōu)化等方向開(kāi)展。
DeepSeek一鳴驚人的時(shí)刻是在2024年12月,當(dāng)時(shí)宣布正式上線并開(kāi)源了備受期待的DeepSeek-V3模型。該模型以驚人的效率迅速走紅,在數(shù)學(xué)、代碼能力以及中文知識(shí)問(wèn)答領(lǐng)域表現(xiàn)全面超越了ChatGPT-4o。在算力成本方面,V3僅使用2000個(gè)GPU芯片、總訓(xùn)練成本557.6萬(wàn)美元,完成了性能超越GPT-4o的大模型開(kāi)發(fā)。相比之下,GPT-4o使用了約25000個(gè)GPU芯片,總訓(xùn)練成本接近1億美元。雙方在算力和成本上的差距達(dá)到10倍以上,V3的出現(xiàn)刷新了行業(yè)認(rèn)知。
隨后在2025年1月,DeepSeek正式發(fā)布開(kāi)源推理大模型DeepSeek-R1。其憑借極低的訓(xùn)練成本以及在數(shù)學(xué)推理、代碼生成等任務(wù)中比肩國(guó)際領(lǐng)先水平的表現(xiàn),再次引發(fā)全球AI領(lǐng)域的關(guān)注。低成本、高效能是DeepSeek-R1的關(guān)鍵特征。
業(yè)內(nèi)人士分析認(rèn)為,DeepSeek此時(shí)尋求外部融資可能與其生態(tài)布局和實(shí)現(xiàn)商業(yè)化的需求有關(guān)。從行業(yè)發(fā)展速度來(lái)看,如今AI大模型行業(yè)正從拼模型、拼算力的競(jìng)爭(zhēng)時(shí)代,邁入拼效率、拼價(jià)值、拼生態(tài)的新階段。