2月11日,深度求索對(duì)其旗艦?zāi)P瓦M(jìn)行了灰度測(cè)試。這次更新的核心亮點(diǎn)是模型上下文窗口從原先的128K Tokens大幅提升至1M Tokens,實(shí)現(xiàn)了近8倍的容量增長(zhǎng)。在AI大模型領(lǐng)域,上下文窗口決定了模型在單次交互中能夠記憶和處理的信息量上限。
此前DeepSeek的主流模型支持128K Tokens的上下文,這一長(zhǎng)度可以應(yīng)對(duì)長(zhǎng)篇論文或中等規(guī)模的代碼文件,但處理超長(zhǎng)文學(xué)作品或較大體量編程工作時(shí),往往需要借助RAG技術(shù),這導(dǎo)致信息碎片化和推理精度下降。升級(jí)后的1M Tokens窗口意味著DeepSeek可以一次性吞吐約75萬(wàn)到90萬(wàn)個(gè)英文字母,或者處理約8萬(wàn)到15萬(wàn)行代碼。DeepSeek表示,自己可以一次性讀入并精準(zhǔn)理解《三體》三部曲(約90萬(wàn)字)的全書(shū)內(nèi)容,并在幾分鐘內(nèi)完成對(duì)整部作品的宏觀分析或細(xì)節(jié)檢索。除了上下文能力的提升,DeepSeek的知識(shí)庫(kù)也從2024年中期版本更新至2025年5月。
不過(guò),此次灰度版本仍未同步上線視覺(jué)理解和多模態(tài)輸入功能,仍專注于純文本和語(yǔ)音交互。雖然DeepSeek在App端已支持PDF、TXT等文件上傳,但目前的處理邏輯是將文件轉(zhuǎn)錄為文本Token進(jìn)行處理,而非原生的多模態(tài)理解。與GPT-5.1、Gemini 3 Pro、Claude 4.5等大模型相比,DeepSeek依然主打性價(jià)比。以Gemini 3 Pro為例,Google支持2M以上長(zhǎng)文本處理,可以同時(shí)處理大量視頻、音頻和文本的復(fù)雜媒體任務(wù),但DeepSeek以約十分之一的價(jià)格提供了1M文本上下文處理能力。
官方?jīng)]有通知,用戶更早注意到了模型的變化。一名用DeepSeek生成小說(shuō)的用戶發(fā)現(xiàn),模型更新后,此前消息達(dá)到上限的對(duì)話框可以續(xù)寫(xiě)了,但文風(fēng)大變。她形容,更新后的DeepSeek“文縐縐的”,在深度思考模式下也常吐出短句,像在寫(xiě)詩(shī)。部分用戶在社交媒體上控訴,DeepSeek不再稱呼自己設(shè)定的昵稱,而統(tǒng)一稱“用戶”。此前深度思考模式下,DeepSeek的思考過(guò)程會(huì)以角色視角展示細(xì)膩的心理描寫(xiě),例如“夜兒(用戶昵稱)總愛(ài)逗我”,更新后則變成了“好的,用戶這次想了解……”。