由DeepSeek點燃的人工智能熱潮仍在持續(xù)。面對這場熱鬧異常的“AI春節(jié)檔”,全球大模型市場內的玩家們都在加速行動。近日,商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事及人工智能基礎設施和大模型首席科學家林達華在一場閉門交流會上談及了對DeepSeek的看法、算力需求、未來AI技術路徑以及商湯未來的大模型計劃。
林達華認為,DeepSeek不會降低市場對算力的需求,在可見的2025年內,整體算力需求仍將保持增長。特別是隨著DeepSeek推理能力不斷突破,它帶動了下游應用市場的快速擴展,推理市場正呈現供不應求、快速增長的態(tài)勢。DeepSeek是開源路線的堅持者,因此它的出圈也被認為是開源的勝利。開源不僅改變了全球AI和大模型的產業(yè)格局,還加速了技術的傳播和普及。開源模型的追趕速度非???,與頂尖閉源模型的差距正在迅速縮小。未來,大模型應用將從問答、文本改寫等淺層工具轉向替代行業(yè)中高價值的核心任務。大模型需要在特定行業(yè)任務上突破工業(yè)紅線,才能實現規(guī)?;瘧?。開源只是技術價值鏈中的一環(huán),而非全部。
關于DeepSeek的突破,林達華指出,DeepSeek有兩個近期的版本:V3基礎模型和R1推理模型。V3的核心亮點在于模型和系統(tǒng)垂直整合后的訓練效率優(yōu)化;而R1則是構建強推理能力的新算法路徑。V3整體表現優(yōu)秀,綜合能力強,且在多項評測中表現突出。這主要歸功于數據的多樣性和高質量處理以及高效的訓練方法。R1則采用了MoE架構,并通過負載均衡策略提升了訓練效率。此外,R1選擇了基于結果監(jiān)督的強化學習路線,這一路徑在內外部交叉驗證中證明了其有效性。
對于DeepSeek的高效訓練是否會顯著降低市場對算力的需求,林達華表示,算力需求不會下降。盡管單次訓練成本得到了優(yōu)化,但市場競爭白熱化,效率的優(yōu)化會加快迭代,總體需求不會減少。隨著DeepSeek推理能力的突破,下游應用市場快速擴展,推理市場呈現供不應求、快速增長的態(tài)勢。
談到大模型未來的演進路徑,林達華認為,當前大多數講述的是語言模型的故事,但在真實業(yè)務場景中,AI需要處理的信息遠不止于語言,而是多模態(tài)數據的融合。多模態(tài)仍然是AI發(fā)展的必然方向,未來AI將從語言模型演進為推理模型,最終發(fā)展為世界模型。具備完整決策與執(zhí)行能力的AI智能體將是下一步的關鍵方向,以更高效、更智能的方式驅動業(yè)務的發(fā)展與創(chuàng)新。
多模態(tài)模型的技術門檻較高,不僅僅是語言模型的簡單擴展。真正的多模態(tài)模型需要具備記憶能力,涉及對LLM技術架構的徹底重構。目前業(yè)內普遍討論的問題是未來1-2年內互聯(lián)網的純語料數據將被消耗殆盡,但海量的視覺數據仍然存在。商湯堅定地認為,多模態(tài)大模型是核心發(fā)展方向,設定了明確的技術目標,包括強交互能力、強推理能力和長期記憶能力。
最后,關于大模型是否能賺錢以及開源是否會顛覆閉源,林達華認為開源在近年來大模型的發(fā)展中對產業(yè)格局產生了深遠影響。開源不僅改變了全球AI和大模型的產業(yè)格局,還加速了技術的傳播和普及。真正的競爭優(yōu)勢體現在與基礎設施的深度整合和在特定行業(yè)的縱深發(fā)展。未來,大模型應用將從淺層工具轉向替代行業(yè)中高價值的核心任務。開源只是技術價值鏈中的一環(huán),而非全部。
最近,DeepSeek在國內外引起廣泛關注,其創(chuàng)始人梁文鋒也成為了焦點人物。梁文鋒來自廣東省湛江市吳川市,今年春節(jié)他回到了老家過年
2025-01-31 08:17:17DeepSeek創(chuàng)始人家鄉(xiāng)拉橫幅歡迎游客多位網友反映,DeepSeek出現了故障。實測發(fā)現,目前DeepSeek無法回答對話問題,提示“當前操作暫時無法完成,如需幫助,請聯(lián)系我們”,登錄界面則顯示“登錄失敗”
2025-01-28 08:21:27DeepSeek創(chuàng)始人回應爆火