國(guó)產(chǎn)AI公司深度求索(DeepSeek)的出現(xiàn)不僅成為科技圈焦點(diǎn),也引起了資本市場(chǎng)的廣泛關(guān)注,并且還在不斷擴(kuò)展影響力。數(shù)據(jù)顯示,DeepSeek應(yīng)用上線(xiàn)20天,日活躍用戶(hù)就突破了2000萬(wàn),包括阿里、騰訊、華為、百度等國(guó)內(nèi)多個(gè)云巨頭均宣布接入DeepSeek,形成了強(qiáng)大的“朋友圈”。
DeepSeek之所以在全球范圍內(nèi)迅速走紅,主要是因?yàn)槠渚邆洹皬?qiáng)能力、低成本”的特點(diǎn)。中信證券指出,DeepSeek-R1的推理能力對(duì)標(biāo)OpenAI o1,在數(shù)學(xué)、編程和復(fù)雜問(wèn)題解決等領(lǐng)域表現(xiàn)出色。例如,在AIME 2024測(cè)試集中,R1得分79.8,與OpenAI-o1-1217的79.2分相近;在編程方面,R1在Codeforces測(cè)試集上得分為2029,接近OpenAI-o1-1217的2061分。
華泰證券表示,DeepSeek在技術(shù)創(chuàng)新方面有顯著優(yōu)勢(shì),特別是在模型架構(gòu)創(chuàng)新、訓(xùn)練方法突破、蒸餾優(yōu)化和推理效率提升等方面。此外,中信建投證券認(rèn)為,盡管DeepSeek-R1性能已基本達(dá)到OpenAI-o1水平,但與o3模型相比仍有差距。不過(guò),隨著技術(shù)迭代,其性能有望持續(xù)增長(zhǎng)。
成本方面,DeepSeek的優(yōu)勢(shì)更加明顯。中信建投證券指出,DeepSeek通用及推理模型的成本相較于OpenAI同類(lèi)模型大幅降低。例如,DeepSeek-V3 API服務(wù)定價(jià)為每百萬(wàn)輸入tokens 0.5元至2元,而OpenAI GPT-4o的API服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1.25美元至2.5美元。這使得DeepSeek在實(shí)際應(yīng)用中能夠帶來(lái)顯著的成本節(jié)約。
然而,華泰證券強(qiáng)調(diào),雖然DeepSeek的總體投資規(guī)??捎^,但其高效的訓(xùn)練方法和創(chuàng)新的模型架構(gòu)確實(shí)降低了推理成本。據(jù)估計(jì),DeepSeek的GPU投資超過(guò)5億美元,總擁有成本(TCO)在四年內(nèi)可能達(dá)到25.73億美元。
在產(chǎn)業(yè)層面,DeepSeek的崛起將對(duì)AI產(chǎn)業(yè)格局產(chǎn)生重要影響。首先是開(kāi)源生態(tài)促進(jìn)“AI平權(quán)”,為AI產(chǎn)業(yè)注入活力。DeepSeek-R1采用MIT License完全開(kāi)源,不限制商用,理論上所有的小參數(shù)模型都能利用R1的數(shù)據(jù)增強(qiáng)推理性能。英偉達(dá)、英特爾、亞馬遜、微軟、AMD等海外巨頭紛紛接入DeepSeek,開(kāi)源模式有望推動(dòng)AI應(yīng)用快速落地。
中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)