中國人工智能初創(chuàng)公司深度求索(DeepSeek)于3月24日深夜低調(diào)上線了新版本DeepSeek-V3-0324,參數(shù)量達到6850億。該版本在代碼、數(shù)學(xué)和推理等多個方面的能力顯著提升,尤其是代碼能力已經(jīng)接近美國Anthropic公司的大模型Claude 3.7。
外界對DeepSeek-V3-0324的關(guān)注不僅在于其能力提升,還猜測這是否預(yù)示著更新一代的V4與R2大模型即將發(fā)布。據(jù)DeepSeek介紹,新版本的主要改進包括:代碼能力顯著增強,能夠一次性生成800行無錯誤的網(wǎng)頁代碼,并實現(xiàn)動態(tài)響應(yīng)式布局和交互效果;數(shù)學(xué)與邏輯推理能力也有所提高,部分表現(xiàn)接近專業(yè)推理模型;此外,V3-0324采用MIT許可證,允許自由修改、分發(fā)及商業(yè)化應(yīng)用,降低了開發(fā)者的使用門檻。
清華大學(xué)新聞學(xué)院和人工智能學(xué)院教授沈陽表示,DeepSeek-V3-0324不僅是V3系列的一次迭代,也是中國AI技術(shù)崛起的重要標志。其在性能、效率和開源策略上的綜合優(yōu)勢使其在全球大語言模型領(lǐng)域占據(jù)重要地位。未來,DeepSeek可能通過進一步提升推理能力和擴展多模態(tài)功能來鞏固技術(shù)領(lǐng)先優(yōu)勢,同時在中美競爭和社區(qū)生態(tài)中尋找平衡點。盡管這次更新看似是一次“小更新”,但其性能跳躍表明該團隊可能在為后續(xù)重大版本做準備。
路透社今年2月底報道,DeepSeek原計劃在今年5月初發(fā)布R2,但現(xiàn)在希望盡早推出,具體時間尚未透露。DeepSeek希望新模型在代碼生成和多語言推理方面的表現(xiàn)進一步提升。不過,這些傳言沒有得到DeepSeek公司的證實或回應(yīng)。
沈陽指出,DeepSeek-V3-0324的推出進一步凸顯了中國AI企業(yè)在技術(shù)和成本上的競爭力。美國對中國GPU出口限制可能促使中國企業(yè)加速國產(chǎn)硬件適配,同時其開源模式可能會引發(fā)西方廠商的連鎖反應(yīng),例如推出更強的閉源模型。他認為2025年可能是中美AI競爭的關(guān)鍵節(jié)點。
在OpenAI公司計劃將通用大模型和推理大模型融合在一起的背景下,外界關(guān)注包括DeepSeek在內(nèi)的中國頭部大模型是否會跟隨這一趨勢。沈陽認為這種可能性存在,因為用戶更關(guān)心的是大模型能否提供更為智能和合理的參考答案,而不關(guān)心具體使用的模型類型。
中國人工智能初創(chuàng)公司深度求索(DeepSeek)24日深夜低調(diào)上線了DeepSeek-V3的新版本DeepSeek-V3-0324,參數(shù)量為6850億
2025-03-26 14:15:56外界熱議DeepSeek低調(diào)上新2月23日,2025全球開發(fā)者先鋒大會主辦方確認,近期頗受關(guān)注的DeepSeek參與了今年的大會,但主要是以“閉門會議”的方式低調(diào)參會,具體場次和出席人并未對外公布
2025-02-23 18:03:54DeepSeek低調(diào)參與GDC大會3月24日晚,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324。這次更新是DeepSeek V3模型的小版本升級,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新