DeepSeek發(fā)布了全新的DeepSeek-OCR 2模型,該模型采用了創(chuàng)新的DeepEncoder V2方法。這種方法讓AI能夠根據(jù)圖像的含義動(dòng)態(tài)重排圖像的各個(gè)部分,而不再只是機(jī)械地從左到右掃描。這種方式模擬了人類(lèi)在觀看場(chǎng)景時(shí)所遵循的邏輯流程。
新模型在處理布局復(fù)雜的圖片時(shí)表現(xiàn)優(yōu)于傳統(tǒng)的視覺(jué)-語(yǔ)言模型,實(shí)現(xiàn)了更智能、更具因果推理能力的視覺(jué)理解。
10月20日,人工智能團(tuán)隊(duì)DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開(kāi)源新模型DeepSeek-OCR