商湯聯(lián)合創(chuàng)始人談DeepSeek AI算力需求持續(xù)增長(zhǎng)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-01 20:21:54 觀察者網(wǎng)

由DeepSeek點(diǎn)燃的人工智能熱潮仍在持續(xù)。面對(duì)這場(chǎng)熱鬧異常的“AI春節(jié)檔”，全球大模型市場(chǎng)內(nèi)的玩家們都在加速行動(dòng)。近日，商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事及人工智能基礎(chǔ)設(shè)施和大模型首席科學(xué)家林達(dá)華在一場(chǎng)閉門(mén)交流會(huì)上談及了對(duì)DeepSeek的看法、算力需求、未來(lái)AI技術(shù)路徑以及商湯未來(lái)的大模型計(jì)劃。

林達(dá)華認(rèn)為，DeepSeek不會(huì)降低市場(chǎng)對(duì)算力的需求，在可見(jiàn)的2025年內(nèi)，整體算力需求仍將保持增長(zhǎng)。特別是隨著DeepSeek推理能力不斷突破，它帶動(dòng)了下游應(yīng)用市場(chǎng)的快速擴(kuò)展，推理市場(chǎng)正呈現(xiàn)供不應(yīng)求、快速增長(zhǎng)的態(tài)勢(shì)。DeepSeek是開(kāi)源路線的堅(jiān)持者，因此它的出圈也被認(rèn)為是開(kāi)源的勝利。開(kāi)源不僅改變了全球AI和大模型的產(chǎn)業(yè)格局，還加速了技術(shù)的傳播和普及。開(kāi)源模型的追趕速度非常快，與頂尖閉源模型的差距正在迅速縮小。未來(lái)，大模型應(yīng)用將從問(wèn)答、文本改寫(xiě)等淺層工具轉(zhuǎn)向替代行業(yè)中高價(jià)值的核心任務(wù)。大模型需要在特定行業(yè)任務(wù)上突破工業(yè)紅線，才能實(shí)現(xiàn)規(guī)模化應(yīng)用。開(kāi)源只是技術(shù)價(jià)值鏈中的一環(huán)，而非全部。

關(guān)于DeepSeek的突破，林達(dá)華指出，DeepSeek有兩個(gè)近期的版本：V3基礎(chǔ)模型和R1推理模型。V3的核心亮點(diǎn)在于模型和系統(tǒng)垂直整合后的訓(xùn)練效率優(yōu)化；而R1則是構(gòu)建強(qiáng)推理能力的新算法路徑。V3整體表現(xiàn)優(yōu)秀，綜合能力強(qiáng)，且在多項(xiàng)評(píng)測(cè)中表現(xiàn)突出。這主要?dú)w功于數(shù)據(jù)的多樣性和高質(zhì)量處理以及高效的訓(xùn)練方法。R1則采用了MoE架構(gòu)，并通過(guò)負(fù)載均衡策略提升了訓(xùn)練效率。此外，R1選擇了基于結(jié)果監(jiān)督的強(qiáng)化學(xué)習(xí)路線，這一路徑在內(nèi)外部交叉驗(yàn)證中證明了其有效性。

對(duì)于DeepSeek的高效訓(xùn)練是否會(huì)顯著降低市場(chǎng)對(duì)算力的需求，林達(dá)華表示，算力需求不會(huì)下降。盡管單次訓(xùn)練成本得到了優(yōu)化，但市場(chǎng)競(jìng)爭(zhēng)白熱化，效率的優(yōu)化會(huì)加快迭代，總體需求不會(huì)減少。隨著DeepSeek推理能力的突破，下游應(yīng)用市場(chǎng)快速擴(kuò)展，推理市場(chǎng)呈現(xiàn)供不應(yīng)求、快速增長(zhǎng)的態(tài)勢(shì)。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

商湯聯(lián)合創(chuàng)始人談DeepSeek AI算力需求持續(xù)增長(zhǎng)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)