去年7月,DeepSeek的下載量從高峰期的8000多萬暴跌至2000多萬,下滑了72.2%,成為互聯(lián)網(wǎng)熱議的話題。然而,據(jù)知情人士透露,DeepSeek即將重登王座,計劃在二月中旬發(fā)布新一代模型DeepSeek-V4,正值農(nóng)歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。
這次發(fā)布的重點是代碼生成和處理能力。根據(jù)內(nèi)部基準(zhǔn)測試,V4在編程任務(wù)上的表現(xiàn)超過了市場上的主流競品,如Anthropic的Claude和OpenAI的GPT系列。新模型解決了許多長期困擾AI發(fā)展的技術(shù)難題,可能徹底改變Vibe Coding產(chǎn)業(yè)。
報道中提到,DeepSeek-V4模型在整個訓(xùn)練過程中理解數(shù)據(jù)模式的能力有所改進(jìn),且性能未出現(xiàn)衰減。這意味著模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。例如,之前的DeepSeek-R1模型在數(shù)strawberry里有幾個r時,由于不理解“數(shù)”這個概念,答案通常是錯誤的2而不是3。而DeepSeek-V4則會避免這種情況,前提是讓模型徹底理解某件事情。
此外,V4在不斷學(xué)習(xí)新東西或訓(xùn)練時間加長的過程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒有出現(xiàn)“災(zāi)難性遺忘”或“模型坍塌”。這為構(gòu)建編程Agent提供了前置條件。以往的模型受限于上下文窗口或注意力機(jī)制的衰減,無法對龐大的項目進(jìn)行修改,而V4可能是一個為“Agent時代”量身定制的模型。
一年前,DeepSeek-R1的發(fā)布證明了低成本研發(fā)路徑的可行性。如今,人工智能行業(yè)的關(guān)注焦點已經(jīng)轉(zhuǎn)向代碼生成,這是大模型能力的“試金石”。在當(dāng)前的開發(fā)環(huán)境中,“Vibe Coding”要求AI不僅能補(bǔ)全代碼,還能理解開發(fā)者的意圖流,實現(xiàn)從自然語言到復(fù)雜工程邏輯的無縫轉(zhuǎn)化。DeepSeek似乎已經(jīng)準(zhǔn)備好在新賽道上狂飆。
微信微博快手第一時間為您推送權(quán)威資訊報道全球 傳播中國關(guān)注人民網(wǎng)
2025-09-05 07:52:24英國博主說九三閱兵是給全世界的歷史課近日,國新辦舉行“高質(zhì)量完成‘十四五’規(guī)劃”系列主題新聞發(fā)布會,介紹“十四五”時期大力推進(jìn)新型工業(yè)化有關(guān)情況。
2025-09-13 08:57:28向新而行|中國“新三樣”