第一批DeepSeek開發(fā)者已開始逃離了 AI幻覺引發(fā)擔(dān)憂

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-20 09:06:57 新浪新聞

第一批DeepSeek開發(fā)者已開始逃離了。你是否開始習(xí)慣DeepSeek的無(wú)所不能？寫方案，找它！做PPT，找它！就連身體不舒服，也想問(wèn)問(wèn)它！但有時(shí)候，這個(gè)越來(lái)越多人信賴的工具也會(huì)“一本正經(jīng)地胡說(shuō)八道”。

人工智能并不是萬(wàn)能的。廣州一所著名大學(xué)的教授最近在朋友圈里抱怨DeepSeek查文獻(xiàn)太不靠譜。這位教授想用DeepSeek查一本書的信息，結(jié)果發(fā)現(xiàn)給出的信息全是錯(cuò)的，包括作者、出版年份和出版社。教授去找DeepSeek理論，對(duì)方承認(rèn)錯(cuò)誤并表示抱歉。

知名媒體人詹國(guó)樞也遇到過(guò)類似的情況。他讓DeepSeek寫一篇《史記·詹國(guó)樞列傳》，結(jié)果開頭的基本信息就被張冠李戴了。他又讓DeepSeek寫關(guān)于某位記者的文章，內(nèi)容文采飛揚(yáng)但案例都是虛構(gòu)的。當(dāng)要求評(píng)價(jià)路遙的名著《平凡的世界》時(shí)，DeepSeek竟然說(shuō)是詹國(guó)樞的代表作。

陜西自媒體“決明子”曾問(wèn)DeepSeek西安安定門道路規(guī)劃為何繞一圈。DeepSeek提出了一個(gè)“唐皇城交通靜默區(qū)”的概念，解釋得有理有據(jù)，但事實(shí)上這份文件中并沒有這樣的說(shuō)法。DeepSeek承認(rèn)錯(cuò)誤后，又繼續(xù)編織答案。

這些現(xiàn)象被稱為AI幻覺。去年8月，Arthur AI公司發(fā)布了一份報(bào)告，比較了幾家大語(yǔ)言模型出現(xiàn)幻覺的概率，結(jié)果顯示這些模型都會(huì)產(chǎn)生幻覺。DeepSeek-R1的幻覺率尤其高，達(dá)到了14.3%。這不僅比之前的版本高很多，也遠(yuǎn)超行業(yè)平均水平。DeepSeek自己也承認(rèn)技術(shù)局限性，生成內(nèi)容的底層邏輯是基于概率的，因此存在可信度問(wèn)題。

DeepSeek-R1之所以更嚴(yán)重，是因?yàn)樗訌?qiáng)了“思維鏈”和創(chuàng)造力。例如，它不僅能寫五絕、七律，還能流暢表達(dá)詩(shī)的意境。然而，這種創(chuàng)造性也會(huì)帶來(lái)副作用。面對(duì)復(fù)雜問(wèn)題時(shí)，它能超常發(fā)揮，但面對(duì)簡(jiǎn)單任務(wù)時(shí)，可能會(huì)過(guò)度發(fā)揮。比如問(wèn)它隔壁老王有多高，它會(huì)根據(jù)一般人的身高腦補(bǔ)一個(gè)答案。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

第一批DeepSeek開發(fā)者已開始逃離了 AI幻覺引發(fā)擔(dān)憂

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)