电竞下注-中国电竞赛事及体育赛事平台

<source id="171hs"><var id="171hs"></var></source>

中華網(wǎng) china.com

新聞

國(guó)內(nèi) 國(guó)際社會(huì) 體育專題軍事財(cái)經(jīng) 滾動(dòng) 政務(wù) 冬奧

DeepSeek的新模型很瘋狂：整個(gè)AI圈都在研究視覺(jué)路線，Karpathy不裝了(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-10-21 13:55:19 新浪財(cái)經(jīng)

這種壓縮方法或許能大幅擴(kuò)展模型的有效上下文長(zhǎng)度，特別是與DeepSeek幾周前發(fā)布的稀疏注意力機(jī)制論文結(jié)合時(shí)。盡管谷歌可能已經(jīng)掌握了類似技術(shù)，但DeepSeek選擇完全開(kāi)源，包括模型權(quán)重和方法細(xì)節(jié)，使得任何人都可以試驗(yàn)并進(jìn)一步探索這一突破。

Hacker News等平臺(tái)上，DeepSeek-OCR引發(fā)了廣泛討論。Django Web框架的聯(lián)合創(chuàng)建者Simon Willison成功在英偉達(dá)Spark硬件上運(yùn)行了該模型，整個(gè)過(guò)程僅用了40分鐘?？萍家曨l播主NiceKate AI也將其部署到了Mac上。

不過(guò)，一些研究者指出，DeepSeek的新模型雖然工程上取得了巨大成功，但其核心思路并非首創(chuàng)。早在2022年，哥本哈根大學(xué)等機(jī)構(gòu)的論文《Language Modelling with Pixels》就提出了基于像素的語(yǔ)言編碼器PIXEL，旨在解決語(yǔ)言模型的詞匯瓶頸問(wèn)題。此后，還有多篇研究成果對(duì)這一思路進(jìn)行了發(fā)展和改進(jìn)。

盡管如此，DeepSeek-OCR確實(shí)是一個(gè)非常實(shí)用的模型，已有不少先行者開(kāi)始使用。但也有人批評(píng)其方法缺乏漸進(jìn)性。無(wú)論如何，DeepSeek-OCR的發(fā)布無(wú)疑為大模型領(lǐng)域帶來(lái)了新的思考方向。

首頁(yè)上一頁(yè)12共 2 頁(yè)

(責(zé)任編輯：0882)

關(guān)閉

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁引發(fā)島內(nèi)嘩然疑慮

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁2025-11-24 12:35:55

上周末我國(guó)多領(lǐng)域迎來(lái)新突破捷報(bào)頻傳

上周末我國(guó)多領(lǐng)域迎來(lái)新突破2025-11-24 12:34:14

專家：高市錯(cuò)誤言論暗藏三大意圖挑戰(zhàn)中方底線

專家,高市錯(cuò)誤言論暗藏三大意圖2025-11-24 12:17:03

美國(guó)宇航局發(fā)布神秘星際天體新圖像，揭示了其真實(shí)本質(zhì)，成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言！

美國(guó)宇航局發(fā)布神秘星際天體新圖像,揭示了其真實(shí)本質(zhì),成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言2025-11-24 12:10:22

中國(guó)無(wú)人駕駛重卡開(kāi)進(jìn)英國(guó)最大港口科技風(fēng)景線閃耀菲力斯杜港

中國(guó)無(wú)人駕駛重卡開(kāi)進(jìn)英國(guó)最大港口2025-11-24 12:02:23

美國(guó)為什么從日本撤走“堤豐”中程導(dǎo)彈系統(tǒng)？局勢(shì)突變引發(fā)撤離

美國(guó)為什么從日本撤走堤豐中程導(dǎo)彈系統(tǒng)2025-11-24 10:57:57

中國(guó)004航母核動(dòng)力真相曝光戰(zhàn)斗力驚人或成全球最大航母

中國(guó)004航母核動(dòng)力真相曝光戰(zhàn)斗力驚人2025-11-24 11:29:29

日本發(fā)生大火今晨仍未被撲滅火勢(shì)持續(xù)蔓延

日本發(fā)生大火今晨仍未被撲滅2025-11-24 12:07:47

加總理：即使沒(méi)有美國(guó)世界也可以運(yùn)轉(zhuǎn) G20共識(shí)仍具分量

加總理,即使沒(méi)有美國(guó)世界也可以運(yùn)轉(zhuǎn)2025-11-24 10:59:03

湖人再勝爵士客場(chǎng)險(xiǎn)勝迎4連勝

湖人再勝爵士2025-11-24 12:14:08

高市早苗被拒進(jìn)入日本相撲擂臺(tái) 傳統(tǒng)規(guī)定引發(fā)爭(zhēng)議

高市早苗被拒進(jìn)入日本相撲擂臺(tái)2025-11-24 11:12:00

首個(gè)報(bào)道南京大屠殺的記者王火去世百歲人生見(jiàn)證歷史

首個(gè)報(bào)道南京大屠殺的記者王火去世2025-11-24 10:49:10

最新！訂單爆棚的公司名單來(lái)了，12家獲機(jī)構(gòu)扎堆關(guān)注業(yè)績(jī)?cè)鲩L(zhǎng)催化劑

最新,訂單爆棚的公司名單來(lái)了,12家獲機(jī)構(gòu)扎堆關(guān)注2025-11-24 12:09:39

上周末我國(guó)多領(lǐng)域迎來(lái)新突破捷報(bào)頻傳

上周末我國(guó)多領(lǐng)域迎來(lái)新突破2025-11-24 12:34:14

張家界荒野求生決賽開(kāi)始 14強(qiáng)選手迎終極挑戰(zhàn)

張家界荒野求生決賽開(kāi)始2025-11-24 12:01:59

日本為啥急于重啟柏崎刈羽核電站能源危機(jī)下的無(wú)奈選擇

日本為啥急于重啟柏崎刈羽核電站2025-11-24 11:07:05

公然挑釁，執(zhí)意玩火！高市早苗挑釁言論會(huì)造成什么樣的惡果？

高市早苗挑釁言論會(huì)造成什么惡果2025-11-24 11:28:33

官方通報(bào)三無(wú)飛機(jī)問(wèn)題面條廠造飛機(jī)暗藏風(fēng)險(xiǎn)

官方通報(bào)三無(wú)飛機(jī)問(wèn)題2025-11-24 12:06:13

特朗普猛烈抨擊烏克蘭領(lǐng)導(dǎo)層感激危機(jī)背后的博弈

特朗普猛烈抨擊烏克蘭領(lǐng)導(dǎo)層2025-11-24 10:57:34

中國(guó)軍隊(duì)堅(jiān)定捍衛(wèi)國(guó)家主權(quán) 維護(hù)地區(qū)和平穩(wěn)定

中國(guó)軍隊(duì)堅(jiān)定捍衛(wèi)國(guó)家主權(quán)2025-11-24 10:50:52

南通崇川區(qū)原一級(jí)調(diào)研員陳躍生被查涉嫌嚴(yán)重違紀(jì)違法

南通崇川區(qū)原一級(jí)調(diào)研員陳躍生被查2025-11-24 12:01:39

公然挑釁，執(zhí)意玩火！高市早苗挑釁言論會(huì)造成什么樣的惡果？

焦點(diǎn)訪談,高市執(zhí)意玩火必將自取滅亡2025-11-24 10:47:48

日本奪島方案“揭秘” 自衛(wèi)隊(duì)三套計(jì)劃曝光

日本奪島方案揭秘2025-11-24 12:03:36

日本一工廠發(fā)生火災(zāi)火勢(shì)無(wú)法控制持續(xù)8小時(shí)未減弱

日本一工廠發(fā)生火災(zāi)火勢(shì)無(wú)法控制2025-11-24 12:10:03

石破茂再批高市早苗外交政策遭嚴(yán)厲批評(píng)

石破茂再批高市早苗2025-11-24 11:11:33

韓國(guó)總統(tǒng)希望早日訪華推進(jìn)中韓合作

韓國(guó)總統(tǒng)希望早日訪華2025-11-24 12:04:17

美發(fā)布“委領(lǐng)空預(yù)警”是要?jiǎng)邮至藛?歷史重演？

美發(fā)布委領(lǐng)空預(yù)警是要?jiǎng)邮至藛?/span>2025-11-24 10:49:39

英偉達(dá)力推對(duì)華芯片銷售中美關(guān)系緩和現(xiàn)曙光

英偉達(dá)力推對(duì)華芯片銷售2025-11-24 11:05:20

專家：高市錯(cuò)誤言論暗藏三大意圖挑戰(zhàn)中方底線

專家,高市錯(cuò)誤言論暗藏三大意圖2025-11-24 12:17:03

美國(guó)專家批評(píng)高市錯(cuò)誤言論轉(zhuǎn)移國(guó)內(nèi)注意力

美國(guó)專家批評(píng)高市錯(cuò)誤言論2025-11-24 11:06:37

日本民眾批評(píng)高市早苗要求其辭職平息局勢(shì)

日本民眾批評(píng)高市早苗2025-11-24 11:04:51

男子臥鋪車廂排便旅客鞋子箱子遭殃醉酒惹禍端

男子臥鋪車廂排便旅客鞋子箱子遭殃2025-11-24 12:05:33

日媒宣傳“敵國(guó)條款”已廢除，事實(shí)真是如此嗎？中國(guó)官方重申條款真相

日媒宣傳敵國(guó)條款已廢除,事實(shí)真是如此嗎2025-11-24 11:08:23

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁引發(fā)島內(nèi)嘩然疑慮

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁2025-11-24 12:35:55

樊振東店長(zhǎng)工作牌樊振東任小米一日店長(zhǎng)

樊振東店長(zhǎng)工作牌2025-11-24 11:59:36

相關(guān)新聞

DeepSeek開(kāi)源新模型DeepSeek-OCR 探索視覺(jué)-文本壓縮邊界
10月20日，人工智能團(tuán)隊(duì)DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開(kāi)源新模型DeepSeek-OCR
DeepSeek使用率暴跌原因何在？新模型R2缺席影響顯著
由于新模型R2遲遲未發(fā)布，DeepSeek近期備受關(guān)注。國(guó)際知名半導(dǎo)體研究機(jī)構(gòu)Semianalysis的報(bào)告顯示，DeepSeek的用戶使用率從年初的7.5%峰值顯著下降至3%，官網(wǎng)流量同期下滑近三成
2025-07-10 13:25:04DeepSeek使用率暴跌原因何在
DeepSeek為何發(fā)表研究成果揭示AI模型秘密
證券時(shí)報(bào)的文章內(nèi)容僅供參考，不構(gòu)成實(shí)質(zhì)性投資建議，據(jù)此操作風(fēng)險(xiǎn)自擔(dān)。下載“證券時(shí)報(bào)”官方APP或關(guān)注官方微信公眾號(hào)，可以隨時(shí)了解股市動(dòng)態(tài)，洞察政策信息，把握財(cái)富機(jī)會(huì)
2025-09-20 12:51:47DeepSeek為何發(fā)表研究成果
DeepSeek在《自然》雜志公布論文 R1模型成本創(chuàng)新低
AI初創(chuàng)公司DeepSeek的論文最近登上了《自然》雜志。該公司表示，其強(qiáng)大的AI模型R1的成功并不依賴于模仿其他大型語(yǔ)言模型生成的示例進(jìn)行訓(xùn)練。這一聲明隨著R1模型同行評(píng)審版本的發(fā)布而公布
2025-09-20 12:18:52DeepSeek在自然雜志公布論文
DeepSeek開(kāi)源新版R1 媲美OpenAI 性能媲美o3模型
DeepSeek開(kāi)源了R1最新0528版本，盡管官方未對(duì)此版本進(jìn)行詳細(xì)說(shuō)明，但已有網(wǎng)友在著名代碼測(cè)試平臺(tái)Live CodeBench中發(fā)現(xiàn)其性能可與OpenAI最新的o3模型高版本相媲美
2025-05-29 08:46:15DeepSeek開(kāi)源新版R1媲美OpenAI
DeepSeek R1模型已完成小版本試升級(jí) 官方邀您體驗(yàn)
5月28日，DeepSeek官方宣布，DeepSeek R1模型已完成小版本試升級(jí)。用戶可以前往官方網(wǎng)頁(yè)、APP或小程序測(cè)試新功能，API接口和使用方式保持不變
2025-05-29 08:41:18DeepSeekR1模型已完成小版本試升級(jí)

今日熱點(diǎn)

4斤黃金鳳冠展出時(shí)被毀誰(shuí)來(lái)賠責(zé)任歸屬引熱議

何晴是唯一演遍四大名著的女演員古典美女隕落

冬季頂流水果價(jià)格大跳水車?yán)遄咏祪r(jià)市民搶購(gòu)

何晴是唯一把四大名著演全的演員清秀古典美永存心間

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報(bào)電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動(dòng)態(tài)
版權(quán)所有中華網(wǎng)

<dl id="m2ihi"><span id="m2ihi"></span></dl>