然而,剛學(xué)會(huì)“睜眼”的 DeepSeek 并不完美。目前的識(shí)圖模式仍存在幾處明顯不足。知識(shí)庫(kù)更新滯后,在某些測(cè)試中,雖然模型的推理過程和分析邏輯正確,但最終答案卻張冠李戴。例如在識(shí)別某款 2025 年底發(fā)布的最新型號(hào)手機(jī)時(shí),因其知識(shí)庫(kù)停留在 2025 年,盡管通過副屏細(xì)節(jié)推斷出舊型號(hào),但仍給出了錯(cuò)誤的具體型號(hào)。此外,在面對(duì)數(shù)圖中老虎數(shù)量、視錯(cuò)覺等高難度反直覺圖形題目時(shí),它的答案依然存在很大的不確定性,有時(shí)經(jīng)過長(zhǎng)時(shí)間“深度思考”后反而會(huì)出現(xiàn)更嚴(yán)重的幻覺,導(dǎo)致邏輯崩潰。目前 DeepSeek 上線的識(shí)圖模式本質(zhì)上是純視覺理解模塊,主要集中在圖片識(shí)別與分析層面,尚未集成圖像生成、視頻理解或跨模態(tài)交互等更為廣義的多模態(tài)功能。