DeepSeek能一直火下去嗎算法創(chuàng)新引領(lǐng)未來(lái)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 10:33:46 澎湃新聞

DeepSeek在大模型領(lǐng)域備受關(guān)注，其用人邏輯與其他公司相似，側(cè)重于年輕且有潛力的人才，通常年齡在1998年左右出生，工作經(jīng)驗(yàn)不超過(guò)五年。這些人才具備聰明、理工科背景和較少的工作經(jīng)驗(yàn)。

與國(guó)內(nèi)其他大模型創(chuàng)業(yè)公司相比，DeepSeek顯得更為幸運(yùn)，沒(méi)有融資壓力，也不需要向投資人證明自己，可以專注于技術(shù)迭代和產(chǎn)品優(yōu)化。然而，作為一家商業(yè)公司，未來(lái)難免會(huì)面臨類似的壓力和挑戰(zhàn)。

2024年中國(guó)大模型圈中，DeepSeek成為最火的公司之一。自去年年中發(fā)起大模型價(jià)格戰(zhàn)以來(lái)，該公司通過(guò)發(fā)布開(kāi)源模型DeepSeek-V3和推理模型DeepSeek-R1徹底引爆了輿論場(chǎng)。DeepSeek-V3僅花費(fèi)557.6萬(wàn)美元訓(xùn)練成本，而DeepSeek-R1則因其出色的性能贏得了廣泛贊譽(yù)。

這家低調(diào)的公司在算法創(chuàng)新方面表現(xiàn)出色，使得算力成本大幅下降。DeepSeek使用了一系列工程技巧優(yōu)化了模型架構(gòu)，如多頭潛在注意力機(jī)制和混合專家模型結(jié)構(gòu)，從而提高了訓(xùn)練效率并降低了成本。此外，DeepSeek還通過(guò)選擇性處理數(shù)據(jù)來(lái)提高訓(xùn)練效率，實(shí)現(xiàn)了高性能與低成本的平衡。

清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授劉知遠(yuǎn)認(rèn)為，DeepSeek的成功證明了中國(guó)在有限資源下也能實(shí)現(xiàn)高效利用。Google DeepMind首席執(zhí)行官德米斯·哈薩比斯也表示，雖然不清楚DeepSeek的具體依賴程度，但其成就令人印象深刻。

DeepSeek的成功并非一蹴而就，而是經(jīng)過(guò)長(zhǎng)期積累的結(jié)果。創(chuàng)始人梁文鋒曾是頭部量化私募幻方量化的創(chuàng)始人，積累了豐富的資金、數(shù)據(jù)和技術(shù)資源。DeepSeek團(tuán)隊(duì)成員主要來(lái)自國(guó)內(nèi)頂尖高校，工作時(shí)間不長(zhǎng)，團(tuán)隊(duì)管理扁平化，氛圍自由。

盡管目前DeepSeek取得了顯著成果，但行業(yè)人士提醒，現(xiàn)在高呼“中國(guó)AI已經(jīng)超越美國(guó)”還為時(shí)過(guò)早。未來(lái)的發(fā)展路徑尚不明朗，中國(guó)仍在追趕階段。隨著商業(yè)化進(jìn)程的推進(jìn)，DeepSeek將面臨更多壓力和挑戰(zhàn)，但其加入對(duì)國(guó)內(nèi)模型行業(yè)來(lái)說(shuō)無(wú)疑是一件好事。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek能一直火下去嗎 算法創(chuàng)新引領(lǐng)未來(lái)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek能一直火下去嗎算法創(chuàng)新引領(lǐng)未來(lái)