媒體：大模型競爭或激發(fā)創(chuàng)新浪潮開啟AI新階段

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-05 13:43:57 光明網(wǎng)

AI產(chǎn)業(yè)進入新階段，大模型競爭可能激發(fā)創(chuàng)新浪潮。近期，深度求索公司發(fā)布的開源模型DeepSeek-R1受到廣泛關(guān)注，百度智能云、騰訊云、阿里云、華為云等多家平臺宣布上線該模型。業(yè)內(nèi)人士認為，這一進展預(yù)示著2025年大模型競爭的新動向，有望推動一波創(chuàng)新浪潮，促使各家企業(yè)探索更具成本效益的AI開發(fā)和部署方法。

根據(jù)深度求索公司的介紹，DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù)，在少量標(biāo)注數(shù)據(jù)的情況下顯著提升了模型的推理能力，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的表現(xiàn)接近OpenAI的GPT-o1正式版模型。

賽智產(chǎn)業(yè)研究院人工智能研究所副所長安赟表示，DeepSeek-R1通過開源策略、低成本高效推理及強化學(xué)習(xí)結(jié)合混合專家架構(gòu)（MoE）等創(chuàng)新，實現(xiàn)了突破性的技術(shù)進展。開源打破了大企業(yè)的技術(shù)壟斷，促進了AI技術(shù)的普及。其低成本的算法優(yōu)化模式改變了長期以來對算力堆砌的依賴，推動了效率導(dǎo)向的競爭格局。

北京前沿未來科技產(chǎn)業(yè)發(fā)展研究院院長陸峰認為，DeepSeek將開啟全球大模型開發(fā)和應(yīng)用的新階段。其高性價比和低訓(xùn)練成本降低了大模型的投資、開發(fā)、運營成本，開放開源性降低了融合應(yīng)用的技術(shù)門檻，為大模型在各行各業(yè)廣泛落地提供了更多可能性。

DeepSeek憑借強大的語言處理能力和技術(shù)優(yōu)勢吸引了眾多國內(nèi)外企業(yè)的關(guān)注。百度智能云、華為云、阿里云、騰訊云、360數(shù)字安全集團等多個平臺相繼宣布上線DeepSeek旗下大模型。此外，英偉達、亞馬遜和微軟也在同一天宣布接入DeepSeek-R1。騰訊云方面表示，騰訊云TI平臺全面支持DeepSeek系列模型的一鍵部署，并提供模型服務(wù)管理、監(jiān)控運營、資源伸縮等功能，幫助企業(yè)將DeepSeek模型高效穩(wěn)定地接入實際業(yè)務(wù)中。

12 全文共 2 頁下一頁

關(guān)閉

媒體：大模型競爭或激發(fā)創(chuàng)新浪潮 開啟AI新階段

相關(guān)新聞

今日熱點

頻道熱點

媒體：大模型競爭或激發(fā)創(chuàng)新浪潮開啟AI新階段