深夜重磅!DeepSeek最新發(fā)布,首批“試用體驗(yàn)”出爐 用戶反饋亮點(diǎn)多多!5月28日晚,DeepSeek宣布其R1模型已完成小版本試升級(jí),用戶可以通過官方網(wǎng)頁(yè)、APP和小程序進(jìn)行測(cè)試,API接口和使用方式保持不變。不過,官方并未公布此次版本更新的具體內(nèi)容。今年3月,DeepSeek曾對(duì)V3模型進(jìn)行小版本升級(jí),并通過官方交流群率先宣布,隨后公布了具體更新內(nèi)容。此前有關(guān)R2大模型的傳聞?lì)l出,但未獲得官方證實(shí)。
DeepSeek的本次升級(jí)是在英偉達(dá)發(fā)布最新財(cái)報(bào)前數(shù)小時(shí)宣布的。作為全球領(lǐng)先的AI芯片制造商,英偉達(dá)的股價(jià)在1月因R1的發(fā)布而遭遇重挫。
據(jù)用戶反饋,DeepSeek升級(jí)后的模型在思維鏈(CoT)的行為上發(fā)生了顯著變化。一些用戶總結(jié)了幾個(gè)亮點(diǎn),包括:深度推理能力增強(qiáng);寫作任務(wù)更自然且格式更好;獨(dú)特的推理風(fēng)格不僅快速而且深思熟慮;能夠長(zhǎng)時(shí)間思考,每個(gè)任務(wù)最多可達(dá)30到60分鐘。
已有網(wǎng)友迫不及待地對(duì)新版R1進(jìn)行測(cè)試,在著名代碼測(cè)試平臺(tái)Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。還有網(wǎng)友對(duì)新版R1的風(fēng)格進(jìn)行了測(cè)試,發(fā)現(xiàn)其幾乎與OpenAI的o3相當(dāng)。
這是自3月底以來(lái)DeepSeek的一次最新動(dòng)作。3月25日晚,DeepSeek公司在官方賬號(hào)上正式宣布V3模型完成小版本升級(jí)的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細(xì)節(jié),包括推理、前端開發(fā)、中文寫作和中文搜索等方面的能力優(yōu)化。當(dāng)時(shí),據(jù)海外專業(yè)AI模型評(píng)測(cè)機(jī)構(gòu)最新排名,新版V3模型是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
然而,自那之后,DeepSeek的熱度開始下降,使用率也有所回落,并引發(fā)了一些質(zhì)疑。目前市場(chǎng)最關(guān)注的是其R2模型的發(fā)布。有傳聞稱,R2大模型的參數(shù)規(guī)模達(dá)到驚人的1.2萬(wàn)億,相比前代R1的6710億參數(shù)幾乎翻倍。這一數(shù)字接近國(guó)際頂尖模型如GPT-4Turbo和谷歌Gemini2.0Pro的水平。R2的動(dòng)態(tài)激活參數(shù)為780億,實(shí)際消耗的計(jì)算量?jī)H為總參數(shù)的6.5%。這種設(shè)計(jì)讓模型在保持高性能的同時(shí),顯著降低了運(yùn)行成本。但這些似乎只是市場(chǎng)人士的臆測(cè),截至目前也未獲得官方證實(shí),R2模型亦未推出。相比之下,Open AI的動(dòng)作相對(duì)較多,人工智能大模型的競(jìng)爭(zhēng)仍在持續(xù)。