AI產(chǎn)業(yè)進入新階段,大模型競爭可能激發(fā)創(chuàng)新浪潮。近期,深度求索公司發(fā)布的開源模型DeepSeek-R1受到廣泛關(guān)注,百度智能云、騰訊云、阿里云、華為云等多家平臺宣布上線該模型。業(yè)內(nèi)人士認為,這一進展預(yù)示著2025年大模型競爭的新動向,有望推動一波創(chuàng)新浪潮,促使各家企業(yè)探索更具成本效益的AI開發(fā)和部署方法。
根據(jù)深度求索公司的介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在少量標(biāo)注數(shù)據(jù)的情況下顯著提升了模型的推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的表現(xiàn)接近OpenAI的GPT-o1正式版模型。
賽智產(chǎn)業(yè)研究院人工智能研究所副所長安赟表示,DeepSeek-R1通過開源策略、低成本高效推理及強化學(xué)習(xí)結(jié)合混合專家架構(gòu)(MoE)等創(chuàng)新,實現(xiàn)了突破性的技術(shù)進展。開源打破了大企業(yè)的技術(shù)壟斷,促進了AI技術(shù)的普及。其低成本的算法優(yōu)化模式改變了長期以來對算力堆砌的依賴,推動了效率導(dǎo)向的競爭格局。
北京前沿未來科技產(chǎn)業(yè)發(fā)展研究院院長陸峰認為,DeepSeek將開啟全球大模型開發(fā)和應(yīng)用的新階段。其高性價比和低訓(xùn)練成本降低了大模型的投資、開發(fā)、運營成本,開放開源性降低了融合應(yīng)用的技術(shù)門檻,為大模型在各行各業(yè)廣泛落地提供了更多可能性。
DeepSeek憑借強大的語言處理能力和技術(shù)優(yōu)勢吸引了眾多國內(nèi)外企業(yè)的關(guān)注。百度智能云、華為云、阿里云、騰訊云、360數(shù)字安全集團等多個平臺相繼宣布上線DeepSeek旗下大模型。此外,英偉達、亞馬遜和微軟也在同一天宣布接入DeepSeek-R1。騰訊云方面表示,騰訊云TI平臺全面支持DeepSeek系列模型的一鍵部署,并提供模型服務(wù)管理、監(jiān)控運營、資源伸縮等功能,幫助企業(yè)將DeepSeek模型高效穩(wěn)定地接入實際業(yè)務(wù)中。
特朗普政府于1月31日晚宣布,要求包括《紐約時報》在內(nèi)的四家媒體從他們在五角大樓的專用辦公場所撤走。此舉的理由是為其他媒體騰出空間
2025-02-02 09:15:45紐約時報等媒體被趕出五角大樓媒體:油價下跌重新開始今早油價實現(xiàn)了2024年的第9次油價上調(diào),部分地區(qū)95號汽油漲回8元時代。
2024-10-25 16:33:43媒體:油價下跌重新開始新華社利馬11月14日電當(dāng)?shù)貢r間11月14日,在赴利馬對秘魯進行國事訪問并出席亞太經(jīng)合組織第三十一次領(lǐng)導(dǎo)人非正式會議之際
2024-11-14 18:00:15習(xí)近平在秘魯媒體發(fā)表署名文章新學(xué)期,新氣象。北京義務(wù)教育學(xué)校課間也迎來新變化。
2024-09-23 17:13:11媒體:課間值得被鄭重對待