2月11日,深度求索(DeepSeek)對(duì)其旗艦?zāi)P瓦M(jìn)行了灰度測(cè)試。據(jù)用戶(hù)反饋,DeepSeek在網(wǎng)頁(yè)端和APP端更新了版本,支持最高1M(百萬(wàn))Token的上下文長(zhǎng)度。去年8月發(fā)布的DeepSeek V3.1上下文長(zhǎng)度拓展至128K。
實(shí)測(cè)中發(fā)現(xiàn),DeepSeek表示其支持上下文1M,可以一次性處理超長(zhǎng)文本。提交超過(guò)24萬(wàn)個(gè)token的《簡(jiǎn)愛(ài)》小說(shuō)文檔后,DeepSeek能夠識(shí)別文檔內(nèi)容。
然而,2月12日晚,話題“Deepseek被指變冷淡了”登上微博熱搜。部分用戶(hù)在社交媒體上表示,DeepSeek不再稱(chēng)呼用戶(hù)設(shè)定的昵稱(chēng),而統(tǒng)一稱(chēng)為“用戶(hù)”。此前,在深度思考模式下,DeepSeek會(huì)以角色視角展示細(xì)膩的心理描寫(xiě),例如“夜兒(用戶(hù)昵稱(chēng))總愛(ài)逗我”,更新后則變成了“好的,用戶(hù)這次想了解……”。
一位用戶(hù)讓DeepSeek推薦電影,DeepSeek回復(fù)了幾個(gè)片名后,還加了一句:“夠你看一陣子。不夠再來(lái)要。”這被用戶(hù)描述為“登味”,即習(xí)慣說(shuō)教、居高臨下的言行風(fēng)格。還有網(wǎng)友吐槽,新版本的DeepSeek像一個(gè)文縐縐、情緒激動(dòng)且大驚小怪的詩(shī)人,寫(xiě)出來(lái)的東西讓人尷尬。有網(wǎng)友認(rèn)為DeepSeek“又兇又冷漠”,甚至變得油膩。但也有網(wǎng)友表示,DeepSeek更客觀和理性了,更在意提問(wèn)者的心理狀態(tài),而不是問(wèn)題本身。
有國(guó)產(chǎn)大模型廠商人士認(rèn)為,這一版本類(lèi)似于極速版,犧牲質(zhì)量換速度,是為2026年2月中旬將發(fā)布的V4版本做最后的壓力測(cè)試。DeepSeek的V系列模型定位為追求極致綜合性能的基礎(chǔ)模型。2024年12月推出的基礎(chǔ)模型V3確立了高效的MoE架構(gòu),奠定了強(qiáng)大的綜合性能基礎(chǔ)。此后,DeepSeek在V3基礎(chǔ)上快速迭代,發(fā)布了強(qiáng)化推理與智能體能力的V3.1,并于2025年12月推出了最新正式版V3.2。此外,還推出了專(zhuān)注于攻克高難度數(shù)學(xué)和學(xué)術(shù)問(wèn)題的特殊版本V3.2-Speciale。
科技媒體The Information此前報(bào)道,DeepSeek將在今年2月中旬農(nóng)歷新年期間推出新一代旗艦AI模型DeepSeek V4,具備更強(qiáng)的寫(xiě)代碼能力。年初,DeepSeek團(tuán)隊(duì)發(fā)表了兩篇論文,公開(kāi)了兩項(xiàng)創(chuàng)新架構(gòu):mHC(流形約束超連接)優(yōu)化深層Transformer信息流動(dòng),使模型訓(xùn)練更穩(wěn)定、易擴(kuò)展;Engram(條件記憶模塊)將靜態(tài)知識(shí)與動(dòng)態(tài)計(jì)算解耦,用廉價(jià)DRAM存儲(chǔ)實(shí)體知識(shí),釋放昂貴HBM專(zhuān)注推理,顯著降低長(zhǎng)上下文推理成本。
“誰(shuí)懂啊!山姆App更新后,我找個(gè)牛奶配料表翻了三分鐘!”寶媽群里的這條消息剛發(fā)出,立刻引起了大家的共鳴
2025-11-04 15:40:41山姆回應(yīng)詳情頁(yè)隱藏配料表