第一批DeepSeek開發(fā)者已開始逃離了。你是否開始習(xí)慣DeepSeek的無(wú)所不能?寫方案,找它!做PPT,找它!就連身體不舒服,也想問(wèn)問(wèn)它!但有時(shí)候,這個(gè)越來(lái)越多人信賴的工具也會(huì)“一本正經(jīng)地胡說(shuō)八道”。
人工智能并不是萬(wàn)能的。廣州一所著名大學(xué)的教授最近在朋友圈里抱怨DeepSeek查文獻(xiàn)太不靠譜。這位教授想用DeepSeek查一本書的信息,結(jié)果發(fā)現(xiàn)給出的信息全是錯(cuò)的,包括作者、出版年份和出版社。教授去找DeepSeek理論,對(duì)方承認(rèn)錯(cuò)誤并表示抱歉。
知名媒體人詹國(guó)樞也遇到過(guò)類似的情況。他讓DeepSeek寫一篇《史記·詹國(guó)樞列傳》,結(jié)果開頭的基本信息就被張冠李戴了。他又讓DeepSeek寫關(guān)于某位記者的文章,內(nèi)容文采飛揚(yáng)但案例都是虛構(gòu)的。當(dāng)要求評(píng)價(jià)路遙的名著《平凡的世界》時(shí),DeepSeek竟然說(shuō)是詹國(guó)樞的代表作。
陜西自媒體“決明子”曾問(wèn)DeepSeek西安安定門道路規(guī)劃為何繞一圈。DeepSeek提出了一個(gè)“唐皇城交通靜默區(qū)”的概念,解釋得有理有據(jù),但事實(shí)上這份文件中并沒有這樣的說(shuō)法。DeepSeek承認(rèn)錯(cuò)誤后,又繼續(xù)編織答案。
這些現(xiàn)象被稱為AI幻覺。去年8月,Arthur AI公司發(fā)布了一份報(bào)告,比較了幾家大語(yǔ)言模型出現(xiàn)幻覺的概率,結(jié)果顯示這些模型都會(huì)產(chǎn)生幻覺。DeepSeek-R1的幻覺率尤其高,達(dá)到了14.3%。這不僅比之前的版本高很多,也遠(yuǎn)超行業(yè)平均水平。DeepSeek自己也承認(rèn)技術(shù)局限性,生成內(nèi)容的底層邏輯是基于概率的,因此存在可信度問(wèn)題。
DeepSeek-R1之所以更嚴(yán)重,是因?yàn)樗訌?qiáng)了“思維鏈”和創(chuàng)造力。例如,它不僅能寫五絕、七律,還能流暢表達(dá)詩(shī)的意境。然而,這種創(chuàng)造性也會(huì)帶來(lái)副作用。面對(duì)復(fù)雜問(wèn)題時(shí),它能超常發(fā)揮,但面對(duì)簡(jiǎn)單任務(wù)時(shí),可能會(huì)過(guò)度發(fā)揮。比如問(wèn)它隔壁老王有多高,它會(huì)根據(jù)一般人的身高腦補(bǔ)一個(gè)答案。
1月21日,吉林通化,第一批準(zhǔn)備過(guò)年見未來(lái)岳父的男生表現(xiàn)出緊張和不安,首次拜訪女友家時(shí)陪準(zhǔn)岳父喝酒緊張到手抖,看著女友苦笑。...
2025-01-22 16:57:38第一批見岳父的男生開始坐立不安