8月21日,深度求索正式發(fā)布了DeepSeek-V3.1大語言模型。這款新模型最大的技術(shù)亮點(diǎn)是“混合推理架構(gòu)”,能夠在單一架構(gòu)內(nèi)同時(shí)支持思考模式與非思考模式。用戶可以通過“深度思考”按鈕實(shí)現(xiàn)無縫切換,在復(fù)雜任務(wù)中啟用鏈?zhǔn)酵评?,在簡單任?wù)中快速響應(yīng)。
根據(jù)官方數(shù)據(jù),DeepSeek-V3.1-Think在多項(xiàng)專業(yè)評測中表現(xiàn)突出,如AIME 2025、GPQA和LiveCodeBench等基準(zhǔn)測試中與前代模型R1-0528性能持平,但輸出token數(shù)減少20%~50%,顯著降低了推理成本。在非思考模式下,模型也能以更短的輸出長度保持同等性能。
此次升級被視為DeepSeek在AGI競爭中的關(guān)鍵一步,標(biāo)志著國產(chǎn)大模型間的競爭進(jìn)入“智能體驅(qū)動”階段。DeepSeek同步開源了V3.1的Base模型和后訓(xùn)練模型,參數(shù)規(guī)模達(dá)840B tokens,并在Hugging Face和魔搭社區(qū)開放下載。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文統(tǒng)一擴(kuò)展至128K。
值得注意的是,DeepSeek宣布自9月6日起調(diào)整API定價(jià)并取消夜間優(yōu)惠。輸入價(jià)格上,緩存命中時(shí)為0.5元/百萬tokens,緩存未命中的價(jià)格則為4元/百萬tokens;輸出價(jià)格為12元/百萬tokens。這一舉措被業(yè)內(nèi)解讀為,深度求索將從年初的關(guān)注價(jià)格轉(zhuǎn)向價(jià)值競爭的信號。此外,V3.1使用的UE8M0FP8精度是針對下一代國產(chǎn)芯片設(shè)計(jì)的,這可能意味著DeepSeek在硬件適配方面投入了更多資源。
DeepSeek-V3.1的發(fā)布反映了國產(chǎn)大模型競爭焦點(diǎn)正從“長上下文”轉(zhuǎn)向“智能體能力”。今年7月,月之暗面發(fā)布的Kimi K2是一個(gè)擁有萬億參數(shù)規(guī)模的混合專家模型,在SWE Bench Verified、Tau2和AceBench等基準(zhǔn)性能測試中均取得開源模型中的最高水平成績。Kimi K2可以幫助用戶直接制定旅行計(jì)劃并預(yù)訂機(jī)票和酒店。
智譜AI在7月28日發(fā)布的GLM-4.5系列也定位為“Agent原生基礎(chǔ)模型”,并在8月20日發(fā)布了全球首個(gè)手機(jī)Agent AutoGLM2.0,具備推理、代碼與多模態(tài)的全能能力,同樣可以一鍵訂票訂咖啡。DeepSeek-V3.1也在編程智能體測評和搜索智能體測評中表現(xiàn)出色。
隨著智能體應(yīng)用場景的深化,國產(chǎn)大模型或?qū)摹盎A(chǔ)能力追趕”進(jìn)入“垂直領(lǐng)域深耕”階段,廠商將在推理效率、工具調(diào)用生態(tài)和成本控制之間找到平衡點(diǎn)。
4月7日,日本吉野家宣布,為應(yīng)對原材料價(jià)格、流通成本和勞動力成本的長期上漲,決定自4月10日起對部分產(chǎn)品價(jià)格進(jìn)行調(diào)整
2025-04-08 08:48:00日本吉野家宣布漲價(jià)7月1日,特斯拉官方微博宣布Model 3長續(xù)航全輪驅(qū)動版車型迎來升級。此次升級使得該車型的CLTC續(xù)航里程提升至753公里,百公里加速時(shí)間縮短至3.8秒
2025-07-01 20:38:44特斯拉中國宣布漲價(jià)