外界熱議DeepSeek低調(diào)“上新” V4與R2猜想再起

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-26 14:15:56 環(huán)球時(shí)報(bào)

中國(guó)人工智能初創(chuàng)公司深度求索（DeepSeek）24日深夜低調(diào)上線了DeepSeek-V3的新版本DeepSeek-V3-0324，參數(shù)量為6850億。新版本在代碼、數(shù)學(xué)、推理等多個(gè)方面的能力顯著提升，甚至代碼能力追平美國(guó)Anthropic公司大模型Claude 3.7。外界對(duì)DeepSeek-V3-0324的關(guān)注不僅在于其性能提升，還猜測(cè)這是否意味著更新一代的V4與R2大模型即將發(fā)布。

關(guān)于DeepSeek-V3新版本的能力提升，DeepSeek表示，新版本代碼能力顯著提升，接近Claude 3.7水平。例如，有用戶(hù)在實(shí)測(cè)中發(fā)現(xiàn)，V3-0324能一次性生成800行無(wú)錯(cuò)誤的網(wǎng)頁(yè)代碼，并實(shí)現(xiàn)動(dòng)態(tài)響應(yīng)式布局和交互效果。此外，新版本的數(shù)學(xué)與邏輯推理能力也有所增強(qiáng)，如經(jīng)典的“4升水壺問(wèn)題”和數(shù)學(xué)競(jìng)賽題，部分表現(xiàn)接近專(zhuān)業(yè)推理模型。V3-0324采用MIT許可證，允許自由修改、分發(fā)及商業(yè)化應(yīng)用，進(jìn)一步降低了開(kāi)發(fā)者的使用門(mén)檻。

清華大學(xué)新聞學(xué)院、人工智能學(xué)院教授沈陽(yáng)認(rèn)為，DeepSeek-V3-0324不僅是V3系列的一次迭代，更是中國(guó)AI技術(shù)崛起的又一力證。其在性能、效率和開(kāi)源策略上的綜合優(yōu)勢(shì)使其在全球大語(yǔ)言模型領(lǐng)域占據(jù)重要地位。未來(lái)，DeepSeek可能通過(guò)推理能力提升和多模態(tài)擴(kuò)展來(lái)鞏固技術(shù)領(lǐng)先優(yōu)勢(shì)，同時(shí)在中美競(jìng)爭(zhēng)和社區(qū)生態(tài)中尋找平衡。沈陽(yáng)指出，DeepSeek-V3-0324的發(fā)布看似是一次“小更新”，但其性能跳躍表明該團(tuán)隊(duì)可能在為后續(xù)重大版本鋪路。

路透社今年2月底引述知情人士的說(shuō)法稱(chēng)，DeepSeek原計(jì)劃在今年5月初發(fā)布R2，但現(xiàn)在希望盡早推出，具體時(shí)間尚未透露。此外，DeepSeek希望新模型在代碼生成和多語(yǔ)言推理方面的表現(xiàn)進(jìn)一步提升。不過(guò)，這些傳言并未得到DeepSeek公司的證實(shí)與回應(yīng)。

沈陽(yáng)表示，DeepSeek-V3-0324的推出進(jìn)一步凸顯中國(guó)AI企業(yè)在技術(shù)與成本上的競(jìng)爭(zhēng)力。美國(guó)對(duì)華GPU出口限制可能促使中國(guó)企業(yè)加速?lài)?guó)產(chǎn)硬件適配，同時(shí)其開(kāi)源模式或引發(fā)西方廠商的連鎖動(dòng)作，例如推出更強(qiáng)閉源模型。他認(rèn)為，2025年可能是中美AI競(jìng)爭(zhēng)的分水嶺。

在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下，外界關(guān)注包括DeepSeek在內(nèi)的中國(guó)頭部大模型是否會(huì)最終出現(xiàn)這種合并的趨勢(shì)。沈陽(yáng)認(rèn)為這種可能性存在，因?yàn)閷?duì)于用戶(hù)來(lái)說(shuō)，更關(guān)心的是大模型能否給出更為智能、合理的參考答案。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

外界熱議DeepSeek低調(diào)“上新” V4與R2猜想再起

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)