DeepSeek用戶期待的R2模型尚未到來(lái),但V3.1版本已經(jīng)發(fā)布。8月21日,DeepSeek官方公眾號(hào)宣布最新大語(yǔ)言模型DeepSeek-V3.1正式上線,距離上一個(gè)版本DeepSeek-V3-0324已有五個(gè)月。
新版本在三個(gè)方面進(jìn)行了升級(jí):混合推理架構(gòu)、更高的思考效率以及更強(qiáng)的Agent能力。從命名來(lái)看,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。該模型支持兩種工作模式——思考模式和非思考模式。面對(duì)簡(jiǎn)單問(wèn)題時(shí),它以非思考模式快速作答;處理復(fù)雜問(wèn)題時(shí),則切換到思考模式,提供更具深度和邏輯的答案。用戶可以通過(guò)官方App或網(wǎng)頁(yè)端的“深度思考”按鈕來(lái)切換這兩種模式。
與之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短時(shí)間內(nèi)給出答案,并且經(jīng)過(guò)思維鏈壓縮訓(xùn)練后,token消耗量減少了20%至50%,同時(shí)保持了與R1-0528相當(dāng)?shù)娜蝿?wù)表現(xiàn)。此外,在非思考模式下,新模型的輸出長(zhǎng)度也得到了有效控制,能夠在輸出長(zhǎng)度明顯減少的情況下保持相同的性能。
通過(guò)Post-Training優(yōu)化,新模型在工具使用與編程、搜索等智能體任務(wù)中的表現(xiàn)大幅提升。在代碼修復(fù)和命令行終端任務(wù)測(cè)試中,DeepSeek-V3.1的表現(xiàn)顯著優(yōu)于以往模型。社區(qū)第三方測(cè)試數(shù)據(jù)顯示,在Aider多語(yǔ)言編程基準(zhǔn)測(cè)試中,V3.1取得了71.6%的高分,超越了多個(gè)知名模型,完成一次編程任務(wù)的成本僅為1.01美元,成本效益優(yōu)勢(shì)顯著。
隨著V3.1的發(fā)布,DeepSeek調(diào)整了API接口調(diào)用價(jià)格,并取消了夜間優(yōu)惠。自北京時(shí)間2025年9月6日凌晨起,輸入價(jià)格方面,緩存命中時(shí)為0.5元/百萬(wàn)tokens,緩存未命中時(shí)則漲至4元/百萬(wàn)tokens;輸出價(jià)格調(diào)整為12元/百萬(wàn)tokens。DeepSeek還在評(píng)論區(qū)提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度,并對(duì)分詞器及chat template進(jìn)行了較大調(diào)整,與DeepSeek-V3存在明顯差異。UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)的。