清華大學(xué)計(jì)算機(jī)系教授翟季冬認(rèn)為,DeepSeek在算法和系統(tǒng)軟件層次做了許多創(chuàng)新,對(duì)中國(guó)未來發(fā)展AI產(chǎn)業(yè)至關(guān)重要。如今,o3 mini和DeepSeek R1都使用大量監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)等技術(shù),展示了稀疏化MoE架構(gòu)的重要性。
整體來看,算法的進(jìn)步使得模型訓(xùn)練成本大幅降低,同時(shí)提高了模型的能力。Anthropic首席執(zhí)行官Dario Amodei認(rèn)為,算法的進(jìn)步可以帶來10倍的改進(jìn),GPT-3質(zhì)量的推理定價(jià)已下降1200倍。
OpenAI發(fā)布的o3-mini模型在價(jià)格和性能上具有競(jìng)爭(zhēng)力,多項(xiàng)技術(shù)能力超越了DeepSeek R1。奧爾特曼首次正面承認(rèn)OpenAI的閉源是一個(gè)錯(cuò)誤,并計(jì)劃將某些模型進(jìn)行開源。此外,o3-mini模型在科學(xué)、數(shù)學(xué)和編碼方面表現(xiàn)出色,測(cè)試人員更喜歡其回答。
然而,DeepSeek正面臨美國(guó)政企各方面的調(diào)查壓力。微軟和OpenAI開始調(diào)查DeepSeek是否采用其數(shù)據(jù),美國(guó)總統(tǒng)特朗普警告稱需要限制對(duì)華AI半導(dǎo)體出口。Dario Amodei認(rèn)為,DeepSeek的突破迫使美國(guó)重新評(píng)估技術(shù)封鎖政策的有效性。
中歐國(guó)際工商學(xué)院教授譚寅亮表示,DeepSeek的成功依賴于高效的算力調(diào)度和模型優(yōu)化能力,而非單純堆積硬件資源。中國(guó)在應(yīng)用層面和用戶體驗(yàn)上有強(qiáng)大創(chuàng)新能力,但在底層技術(shù)上仍需追趕美國(guó)。