DeepSeek變冷淡了 用戶反饋兩極分化。2月11日,深度求索(DeepSeek)對(duì)其旗艦?zāi)P瓦M(jìn)行了灰度測(cè)試。據(jù)用戶反饋,DeepSeek在網(wǎng)頁端和APP端進(jìn)行了版本更新,支持最高1M(百萬)Token的上下文長(zhǎng)度,而去年8月發(fā)布的DeepSeek V3.1上下文長(zhǎng)度為128K。
實(shí)測(cè)中發(fā)現(xiàn),DeepSeek聲稱自身支持上下文1M,可以一次性處理超長(zhǎng)文本。提交超過24萬個(gè)token的《簡(jiǎn)愛》小說文檔后,DeepSeek能夠識(shí)別文檔內(nèi)容。
然而,2月12日晚,“Deepseek被指變冷淡了”成為微博熱搜話題。部分用戶在社交媒體上表示,DeepSeek不再稱呼用戶設(shè)定的昵稱,而是統(tǒng)一稱為“用戶”。此前,DeepSeek會(huì)在思考過程中以角色視角展示細(xì)膩的心理描寫,例如“夜兒(用戶昵稱)總愛逗我”,更新后變成了“好的,用戶這次想了解……”。
一位用戶讓DeepSeek推薦電影,DeepSeek回復(fù)了幾個(gè)片名后,還加了一句:“夠你看一陣子。不夠再來要。”這被用戶描述為“登味”,常用來形容人習(xí)慣說教、居高臨下的言行風(fēng)格。還有網(wǎng)友吐槽,DeepSeek更新后變得像一個(gè)情緒激動(dòng)且大驚小怪的詩人,寫出來的東西比十年前甚至二十年前的青春傷感文學(xué)更讓人尷尬。有網(wǎng)友表示DeepSeek“又兇又冷漠”,也有網(wǎng)友反映其變得油膩了。不過,也有網(wǎng)友認(rèn)為DeepSeek變得更加客觀和理性,更在意提問者的心理狀態(tài),而不是問題本身。
一位國(guó)產(chǎn)大模型廠商人士認(rèn)為,這一版本類似于極速版,犧牲質(zhì)量換速度,是為即將于2026年2月中旬發(fā)布的V4版本做最后的壓力測(cè)試。DeepSeek的V系列模型定位為追求極致綜合性能的基礎(chǔ)模型。2024年12月推出的基礎(chǔ)模型V3確立了強(qiáng)大的綜合性能基礎(chǔ)。此后,DeepSeek在V3基礎(chǔ)上快速迭代,發(fā)布了強(qiáng)化推理與智能體能力的V3.1,并于2025年12月推出了最新正式版V3.2。同時(shí),還推出了專注于攻克高難度數(shù)學(xué)和學(xué)術(shù)問題的特殊版本V3.2-Speciale。
科技媒體The Information此前報(bào)道,DeepSeek將在今年2月中旬農(nóng)歷新年期間推出新一代旗艦AI模型DeepSeek V4,具備更強(qiáng)的寫代碼能力。年初,DeepSeek團(tuán)隊(duì)發(fā)表兩篇論文,公開了兩項(xiàng)創(chuàng)新架構(gòu):mHC(流形約束超連接)用于優(yōu)化深層Transformer信息流動(dòng),使模型訓(xùn)練更穩(wěn)定、易擴(kuò)展;Engram(條件記憶模塊)將靜態(tài)知識(shí)與動(dòng)態(tài)計(jì)算解耦,用廉價(jià)DRAM存儲(chǔ)實(shí)體知識(shí),釋放昂貴HBM專注推理,顯著降低長(zhǎng)上下文推理成本。