4月28日上午,DeepSeek多模態(tài)團隊研究員陳小康在X賬號@PKUCXK上發(fā)布了一條推文:“Soon, we see you. ?”,配圖是兩只藍色的小鯨魚,左邊那只戴著畫有“XX”的黑色眼罩,右邊那只沒戴眼罩、正常露出眼睛。盡管這條推文很快被刪除,但可能暗示DeepSeek的多模態(tài)功能即將上線。
此外,有用戶截圖顯示,chat.deepseek.com輸入框上方曾出現(xiàn)過三個并列的標(biāo)簽——除了原有的“快速模式”和“專家模式”,還多出了一個“識圖模式”,鼠標(biāo)懸停后提示“圖片理解功能內(nèi)測中”。這是DeepSeek出圈以來第一次在主線產(chǎn)品里把視覺理解作為獨立模式呈現(xiàn)。不過這個標(biāo)簽并不是所有用戶都能看到,目前也無法確認它是常態(tài)化的灰度內(nèi)測還是短暫開放后又被回收,官方至今沒有對外說明。
根據(jù)該用戶的測試信息,在試圖模式里,用戶上傳了一張人物照片并提問“這是什么動作姿勢”。DeepSeek思考8秒后,先按位置、手臂、頭部、頭發(fā)、著裝、光影逐項拆解了畫面,再給出最終判斷:這是攝影和社交媒體語境里的“慵懶風(fēng)躺姿”或“清冷氛圍感姿勢”,常出現(xiàn)在小紅書、抖音的“宅家”、“慵懶風(fēng)”、“清冷感”等標(biāo)簽下。值得注意的是,這段思考過程中有一步明確的“自我修正考慮”,模型先列出其他可能的解讀,再判斷“慵懶氛圍感姿勢”是最能涵蓋所有細節(jié)的描述,最后輸出。這種結(jié)構(gòu)化拆解、自我復(fù)核加文化語境識別的組合,已經(jīng)超出DeepSeek過去主線產(chǎn)品上的“圖片識文字”能力層次。
V2EX網(wǎng)友MichaelBitzo 4月29日下午發(fā)帖稱DeepSeek API已經(jīng)返回“識圖模式”字段,但其他用戶實測反饋仍不可用。這意味著接口側(cè)的字段已經(jīng)存在,但調(diào)用尚未對外開放。
DeepSeek正在進行一項名為“識圖模式”的灰度測試。這項新功能與現(xiàn)有的“快速模式”和“專家模式”并列,具備多模態(tài)識別能力,而不僅僅是OCR文字識別
2026-04-30 08:25:15DeepSeek灰測識圖模式技術(shù)人員的新聞圈「極客頭條」來啦,快來看看今天值得關(guān)注的重要新聞。DeepSeek 計劃融資 500 億人民幣,創(chuàng)始人兼 CEO 梁文鋒個人出資 200 億
2026-05-09 13:51:53DeepSeek正式跨入圖文交互時代4月8日,DeepSeek上線了專家模式。在最新版本中,DeepSeek輸入框上方新增了“快速模式”與“專家模式”,這是自DeepSeek走紅以來首次在產(chǎn)品端引入模式分層設(shè)計
2026-04-08 11:45:16DeepSeek上線專家模式