电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

DeepSeek的新模型很瘋狂:整個AI圈都在研究視覺路線,Karpathy不裝了

關(guān)鍵詞:
2025-10-21 13:55:19  新浪財經(jīng)

DeepSeek的新模型很瘋狂:整個AI圈都在研究視覺路線,Karpathy不裝了!DeepSeek-OCR 論文的發(fā)布在一夜之間打破了大模型的傳統(tǒng)范式。昨天下午,全新模型 DeepSeek-OCR 開源,該模型能夠?qū)?000個字的文章壓縮成100個視覺token,壓縮比達到十倍且精度可達97%。使用一塊英偉達A100每天可處理20萬頁數(shù)據(jù)。這種處理方式可能解決大模型領(lǐng)域中的長上下文效率問題,并預示著大模型輸入方式的重要轉(zhuǎn)變。

GitHub上,DeepSeek-OCR項目一夜之間獲得了超過4000個Star。作為開源的小模型,它迅速經(jīng)歷了AI社區(qū)的檢驗,許多專家對此發(fā)表了看法。OpenAI聯(lián)合創(chuàng)始成員之一、前特斯拉自動駕駛總監(jiān)Andrej Karpathy認為這是一個很好的OCR模型。他更感興趣的是,對于大語言模型而言,像素是否比文本更適合做輸入?他提出,所有LLM的輸入都應(yīng)該是圖像,即使有純文本輸入,也應(yīng)先渲染再輸入。這將帶來更高的信息壓縮率和更通用的信息流。

Karpathy還強調(diào)了刪除分詞器的重要性。他認為分詞器丑陋且獨立存在,不是端到端的,引入了Unicode和字節(jié)編碼的問題,增加了安全風險。此外,OCR只是眾多有用的視覺-文本任務(wù)之一,文本-文本任務(wù)可以轉(zhuǎn)換為視覺-文本任務(wù),但反之則不行。

紐約大學助理教授謝賽寧對Karpathy的觀點表示贊同,尤其是關(guān)于計算機視覺與自然語言處理結(jié)合的部分。謝賽寧曾首次將Transformer架構(gòu)與擴散模型結(jié)合,提出了擴散Transformer(DiT),為文生視頻開辟了新道路。

研究者Emanuel指出,在多模態(tài)大語言模型中,視覺token傳統(tǒng)上是“外掛”功能。然而,DeepSeek-OCR通過高效壓縮視覺token,使其比文本token更高效。一萬英文單詞原本對應(yīng)15,000個文本token,但轉(zhuǎn)換成視覺token后可能變成30,000到60,000個。而DeepSeek-OCR的壓縮方法使這一過程變得更加高效。

關(guān)閉

民進黨當局公告日本5地核食管制解禁 引發(fā)島內(nèi)嘩然疑慮

民進黨當局公告日本5地核食管制解禁2025-11-24 12:35:55

上周末我國多領(lǐng)域迎來新突破 捷報頻傳

上周末我國多領(lǐng)域迎來新突破2025-11-24 12:34:14

專家:高市錯誤言論暗藏三大意圖 挑戰(zhàn)中方底線

專家,高市錯誤言論暗藏三大意圖2025-11-24 12:17:03

美國宇航局發(fā)布神秘星際天體新圖像,揭示了其真實本質(zhì),成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言!

美國宇航局發(fā)布神秘星際天體新圖像,揭示了其真實本質(zhì),成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言2025-11-24 12:10:22

中國無人駕駛重卡開進英國最大港口 科技風景線閃耀菲力斯杜港

中國無人駕駛重卡開進英國最大港口2025-11-24 12:02:23

美國為什么從日本撤走“堤豐”中程導彈系統(tǒng)? 局勢突變引發(fā)撤離

美國為什么從日本撤走堤豐中程導彈系統(tǒng)2025-11-24 10:57:57

中國004航母核動力真相曝光 戰(zhàn)斗力驚人 或成全球最大航母

中國004航母核動力真相曝光戰(zhàn)斗力驚人2025-11-24 11:29:29

日本發(fā)生大火今晨仍未被撲滅 火勢持續(xù)蔓延

日本發(fā)生大火今晨仍未被撲滅2025-11-24 12:07:47

加總理:即使沒有美國世界也可以運轉(zhuǎn) G20共識仍具分量

加總理,即使沒有美國世界也可以運轉(zhuǎn)2025-11-24 10:59:03

湖人再勝爵士 客場險勝迎4連勝

湖人再勝爵士2025-11-24 12:14:08

高市早苗被拒進入日本相撲擂臺 傳統(tǒng)規(guī)定引發(fā)爭議

高市早苗被拒進入日本相撲擂臺2025-11-24 11:12:00

首個報道南京大屠殺的記者王火去世 百歲人生見證歷史

首個報道南京大屠殺的記者王火去世2025-11-24 10:49:10

最新!訂單爆棚的公司名單來了,12家獲機構(gòu)扎堆關(guān)注 業(yè)績增長催化劑

最新,訂單爆棚的公司名單來了,12家獲機構(gòu)扎堆關(guān)注2025-11-24 12:09:39

上周末我國多領(lǐng)域迎來新突破 捷報頻傳

上周末我國多領(lǐng)域迎來新突破2025-11-24 12:34:14

張家界荒野求生決賽開始 14強選手迎終極挑戰(zhàn)

張家界荒野求生決賽開始2025-11-24 12:01:59

日本為啥急于重啟柏崎刈羽核電站 能源危機下的無奈選擇

日本為啥急于重啟柏崎刈羽核電站2025-11-24 11:07:05

公然挑釁,執(zhí)意玩火!高市早苗挑釁言論會造成什么樣的惡果?

高市早苗挑釁言論會造成什么惡果2025-11-24 11:28:33

官方通報三無飛機問題 面條廠造飛機暗藏風險

官方通報三無飛機問題2025-11-24 12:06:13

特朗普猛烈抨擊烏克蘭領(lǐng)導層 感激危機背后的博弈

特朗普猛烈抨擊烏克蘭領(lǐng)導層2025-11-24 10:57:34

中國軍隊堅定捍衛(wèi)國家主權(quán) 維護地區(qū)和平穩(wěn)定

中國軍隊堅定捍衛(wèi)國家主權(quán)2025-11-24 10:50:52

南通崇川區(qū)原一級調(diào)研員陳躍生被查 涉嫌嚴重違紀違法

南通崇川區(qū)原一級調(diào)研員陳躍生被查2025-11-24 12:01:39

公然挑釁,執(zhí)意玩火!高市早苗挑釁言論會造成什么樣的惡果?

焦點訪談,高市執(zhí)意玩火必將自取滅亡2025-11-24 10:47:48

日本奪島方案“揭秘” 自衛(wèi)隊三套計劃曝光

日本奪島方案揭秘2025-11-24 12:03:36

日本一工廠發(fā)生火災火勢無法控制 持續(xù)8小時未減弱

日本一工廠發(fā)生火災火勢無法控制2025-11-24 12:10:03

石破茂再批高市早苗 外交政策遭嚴厲批評

石破茂再批高市早苗2025-11-24 11:11:33

韓國總統(tǒng)希望早日訪華 推進中韓合作

韓國總統(tǒng)希望早日訪華2025-11-24 12:04:17

美發(fā)布“委領(lǐng)空預警”是要動手了嗎 歷史重演?

美發(fā)布委領(lǐng)空預警是要動手了嗎2025-11-24 10:49:39

英偉達力推對華芯片銷售 中美關(guān)系緩和現(xiàn)曙光

英偉達力推對華芯片銷售2025-11-24 11:05:20

專家:高市錯誤言論暗藏三大意圖 挑戰(zhàn)中方底線

專家,高市錯誤言論暗藏三大意圖2025-11-24 12:17:03

美國專家批評高市錯誤言論 轉(zhuǎn)移國內(nèi)注意力

美國專家批評高市錯誤言論2025-11-24 11:06:37

日本民眾批評高市早苗 要求其辭職平息局勢

日本民眾批評高市早苗2025-11-24 11:04:51

男子臥鋪車廂排便旅客鞋子箱子遭殃 醉酒惹禍端

男子臥鋪車廂排便旅客鞋子箱子遭殃2025-11-24 12:05:33

日媒宣傳“敵國條款”已廢除,事實真是如此嗎? 中國官方重申條款真相

日媒宣傳敵國條款已廢除,事實真是如此嗎2025-11-24 11:08:23

民進黨當局公告日本5地核食管制解禁 引發(fā)島內(nèi)嘩然疑慮

民進黨當局公告日本5地核食管制解禁2025-11-24 12:35:55

樊振東店長工作牌 樊振東任小米一日店長

樊振東店長工作牌2025-11-24 11:59:36

相關(guān)新聞