电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

國內(nèi) 國際社會(huì) 體育專題軍事財(cái)經(jīng) 滾動(dòng)

你的“龍蝦”真記得你嗎 AI記憶能力測(cè)試結(jié)果不佳(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-04-21 14:41:12 新浪財(cái)經(jīng)

實(shí)驗(yàn)結(jié)果表明，即使是最強(qiáng)的通用智能體系統(tǒng)表現(xiàn)也不佳。表現(xiàn)最好的Codex僅有39.7%的準(zhǔn)確率，Claude Code + Opus 4.6為33.8%，OpenCode（Kimi K2.5）為30.3%，OpenClaw（Kimi K2.5）為25.4%。盡管這些系統(tǒng)擁有完整的代碼執(zhí)行能力和文件系統(tǒng)訪問權(quán)限，但在長(zhǎng)期個(gè)性化記憶問答方面仍顯得力不從心。

雖然ATM-Bench的實(shí)驗(yàn)結(jié)果不盡如人意，但研究團(tuán)隊(duì)認(rèn)為這為未來的長(zhǎng)期記憶機(jī)制與個(gè)性化AI助手的研究開辟了新的方向。工具鏈再完善、模型再強(qiáng)大，也彌補(bǔ)不了記憶架構(gòu)上的根本缺陷。只有當(dāng)AI能夠像人類一樣在數(shù)年的記憶長(zhǎng)河中準(zhǔn)確檢索、關(guān)聯(lián)和推理時(shí)，我們才能真正實(shí)現(xiàn)“個(gè)性化AI”。在此之前，我們不應(yīng)對(duì)其記憶能力抱有過高期望。畢竟，它們連“去年給媽媽買的相機(jī)”都記不住。

ATM-Bench數(shù)據(jù)集已在HuggingFace上線，包含完全人工標(biāo)注的1069個(gè)QA對(duì)、多模態(tài)證據(jù)標(biāo)注、NIAH大海撈針評(píng)估支持以及開箱即用的基準(zhǔn)測(cè)試代碼。

首頁上一頁 12共 2 頁

(責(zé)任編輯：0882)

關(guān)閉

演員盧昱曉發(fā)文向《給阿嬤的情書》致歉：我的行為傷害了電影創(chuàng)作者的心血屏攝事件引發(fā)熱議

演員盧昱曉發(fā)文向給阿嬤的情書致歉,我的行為傷害了電影創(chuàng)作者的心血2026-05-18 11:17:58

“澳車北上”累計(jì)超500萬輛次通關(guān)高效順暢

澳車北上累計(jì)超500萬輛次2026-05-18 11:16:29

7人蒙面搶走2歲幼童主謀是生父家庭悲劇背后的冷漠與預(yù)謀

7人蒙面搶走2歲幼童主謀是生父2026-05-18 11:16:08

“澳車北上”累計(jì)超500萬輛次通關(guān)高效順暢

澳車北上累計(jì)超500萬輛次2026-05-18 11:16:29

開封小伙兒在山東旅游時(shí)勇救跳湖老人義舉溫暖人心

開封小伙兒在山東旅游時(shí)勇救跳湖老人2026-05-18 11:05:51

70城最新房?jī)r(jià)出爐一線城市領(lǐng)漲

70城最新房?jī)r(jià)出爐2026-05-18 11:05:30

韓媒：勞資分歧仍未解政府警告罷工風(fēng)險(xiǎn)

韓媒,勞資分歧仍未解2026-05-18 10:48:56

特朗普訪華后警告“臺(tái)獨(dú)” 美國不會(huì)為臺(tái)灣出兵

特朗普訪華后警告臺(tái)獨(dú)2026-05-18 10:34:48

演員盧昱曉發(fā)文向《給阿嬤的情書》致歉：我的行為傷害了電影創(chuàng)作者的心血屏攝事件引發(fā)熱議

演員盧昱曉發(fā)文向給阿嬤的情書致歉,我的行為傷害了電影創(chuàng)作者的心血2026-05-18 11:17:58

廣西柳州5.2級(jí)地震現(xiàn)場(chǎng)直擊多部門緊急響應(yīng)救援

廣西柳州5,2級(jí)地震現(xiàn)場(chǎng)直擊2026-05-18 11:07:39

美國貿(mào)易代表再度炒作301調(diào)查產(chǎn)能過剩成焦點(diǎn)

美國貿(mào)易代表再度炒作301調(diào)查2026-05-18 10:51:03

俄壯漢單臂舉起120公斤啞鈴，打破兩項(xiàng)世界紀(jì)錄

俄壯漢單臂舉起120公斤啞鈴2026-05-18 11:08:57

俄博主曝俄軍蘇-35擊落烏軍F-16 沉默默認(rèn)事實(shí)

俄博主曝俄軍蘇-35擊落烏軍F-162026-05-18 10:35:34

國際油價(jià)突破110美元加密貨幣市場(chǎng)全線下跌

國際油價(jià)突破110美元2026-05-18 10:49:41

美鷹派議員鼓動(dòng)加大打擊伊朗：他們?cè)谒；ㄕ校涎訒r(shí)間

美鷹派議員鼓動(dòng)加大打擊伊朗,他們?cè)谒；ㄕ?/span>2026-05-18 10:47:57

男子突然惡心嘔吐確診耳石癥復(fù)位后仍需調(diào)理

男子突然惡心嘔吐確診耳石癥2026-05-18 11:09:42

馬克龍非洲行翻車平等伙伴關(guān)系成空談

馬克龍非洲行翻車2026-05-18 10:52:46

黃仁勛怒懟核武比喻：全球10億人在用GPU 把顯卡當(dāng)導(dǎo)彈簡(jiǎn)直是不可理喻反對(duì)AI芯片出口管制

黃仁勛怒懟核武比喻,全球10億人在用GPU把顯卡當(dāng)導(dǎo)彈簡(jiǎn)直是不可理喻2026-05-18 10:53:04

印度一加油站數(shù)百人持桶搶購互毆

印度數(shù)百人持油桶搶購燃油2026-05-18 10:49:20

離職業(yè)內(nèi)工作人員為白鹿發(fā)聲真誠溫柔獲贊

離職業(yè)內(nèi)工作人員為白鹿發(fā)聲2026-05-18 11:11:28

大膽！印度男子偷走寺廟捐款箱現(xiàn)金

印度男子偷走寺廟捐款箱現(xiàn)金2026-05-18 11:12:45

專家談蘇-57擊落預(yù)警機(jī)傳聞信息戰(zhàn)的心理博弈

專家談蘇-57擊落預(yù)警機(jī)傳聞2026-05-18 10:33:35

普京訪問中國，將主要聚焦三個(gè)方面深化中俄戰(zhàn)略合作

普京訪問中國,將主要聚焦三個(gè)方面2026-05-18 10:31:03

普京訪問中國,將主要聚焦三個(gè)方面深化中俄全面合作

普京訪問中國,將主要聚焦三個(gè)方面2026-05-18 10:31:35

指甲蓋大小的芯片能抗9000伏高壓刷新世界紀(jì)錄

指甲蓋大小的芯片能抗9000伏高壓2026-05-18 11:13:21

博主曝俄蘇-35擊落烏軍F-16 烏克蘭沉默默認(rèn)？

博主曝俄蘇-35擊落烏軍F-162026-05-18 10:26:54

7人蒙面搶走2歲幼童主謀是生父家庭悲劇背后的冷漠與預(yù)謀

7人蒙面搶走2歲幼童主謀是生父2026-05-18 11:16:08

韓國Z世代士兵涌入整容院影響軍隊(duì)?wèi)?zhàn)備狀態(tài)

韓國Z世代士兵涌入整容院2026-05-18 11:06:08

曝折疊屏iPhone試產(chǎn)受阻鉸鏈問題成核心卡點(diǎn)

曝折疊屏iPhone試產(chǎn)受阻2026-05-18 11:09:20

埃博拉病毒致死率高達(dá)50%至90% 疫情構(gòu)成國際突發(fā)公共衛(wèi)生事件

埃博拉病毒致死率高達(dá)50%至90%2026-05-18 10:47:12

這屆年輕人愛上逛博物館文化體驗(yàn)新潮流

這屆年輕人愛上逛博物館2026-05-18 11:13:05

默茨再次公開抨擊美國引發(fā)美德關(guān)系惡化擔(dān)憂

默茨再次公開抨擊美國2026-05-18 10:54:51

黃仁勛痛斥將GPU比作核武器類比荒謬

黃仁勛痛斥將GPU比作核武器2026-05-18 10:35:10

駝背的人臉會(huì)慢慢變大堅(jiān)持練背的人后來怎么樣了

駝背的人臉會(huì)慢慢變大2026-05-18 11:07:09

花3萬送娃進(jìn)成長(zhǎng)基地7天后被打骨折求救紙條引發(fā)悲劇

花3萬送娃進(jìn)成長(zhǎng)基地7天后被打骨折2026-05-18 11:14:18

相關(guān)新聞

今日熱點(diǎn)

孫心然獲法網(wǎng)青少年組亞軍將登頂青少年世界第一

世界杯球票炒至230萬美元 8年漲10倍球迷熱情不減

字節(jié)再度否認(rèn)造車聚焦技術(shù)服務(wù)合作

美股科技股大牛市是否終結(jié) AI行情未完待續(xù)

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報(bào)電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動(dòng)態(tài)
版權(quán)所有中華網(wǎng)

<span id="o1cui"></span>

<span id="o1cui"></span>

<span id="o1cui"><progress id="o1cui"><p id="o1cui"></p></progress></span>