人工智能為何會(huì)產(chǎn)生幻覺(jué) 自信的謊言家背后

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-06-21 09:47:28 人民網(wǎng)

在科幻電影中，人工智能常被塑造成全知全能的“超級(jí)大腦”，但現(xiàn)實(shí)中，AI卻時(shí)常表現(xiàn)為“自信的謊言家”。比如，請(qǐng)AI描述“關(guān)公戰(zhàn)秦瓊”，它不僅能“敘述”虛構(gòu)的故事情節(jié)，還會(huì)“猜測(cè)”用戶喜好，煞有介事地編造不存在的文獻(xiàn)檔案。這種現(xiàn)象被稱為“AI幻覺(jué)”，已經(jīng)成為困擾許多人工智能企業(yè)和使用者的現(xiàn)實(shí)難題。

AI之所以會(huì)一本正經(jīng)地胡說(shuō)八道，根源在于其思維方式與人類存在本質(zhì)不同。今天人們?nèi)粘Ｊ褂煤徒佑|最多的AI大模型本質(zhì)上是一個(gè)龐大的語(yǔ)言概率預(yù)測(cè)和生成模型。它通過(guò)分析互聯(lián)網(wǎng)上數(shù)以萬(wàn)億計(jì)的文本，學(xué)習(xí)詞語(yǔ)之間的關(guān)聯(lián)規(guī)律，再像玩猜詞游戲一樣，逐字逐句生成看似合理的回答。這種機(jī)制使AI擅于模仿人類的語(yǔ)言風(fēng)格，但有時(shí)缺乏辨別真?zhèn)蔚哪芰Α?/p>

AI幻覺(jué)的產(chǎn)生與大模型訓(xùn)練的過(guò)程密不可分。AI的知識(shí)體系基本來(lái)源于訓(xùn)練時(shí)“吞下”的數(shù)據(jù)源。來(lái)自互聯(lián)網(wǎng)的各類信息魚龍混雜，其中不乏虛假信息、虛構(gòu)故事和偏見(jiàn)性觀點(diǎn)。這些信息一旦成為AI訓(xùn)練的數(shù)據(jù)源，就會(huì)出現(xiàn)數(shù)據(jù)源污染。當(dāng)某個(gè)領(lǐng)域?qū)I(yè)數(shù)據(jù)不足時(shí)，AI便可能通過(guò)模糊性的統(tǒng)計(jì)規(guī)律來(lái)“填補(bǔ)空白”。例如，將科幻小說(shuō)中的“黑科技”描述為真實(shí)存在的技術(shù)。隨著AI越來(lái)越多地用于信息生產(chǎn)，AI生成的海量虛構(gòu)內(nèi)容和錯(cuò)誤信息正在進(jìn)入訓(xùn)練下一代AI的內(nèi)容池，這種“套娃”生態(tài)將進(jìn)一步加劇AI幻覺(jué)的產(chǎn)生。

在大模型訓(xùn)練過(guò)程中，為了使AI生成滿足用戶需求的內(nèi)容，訓(xùn)練者會(huì)設(shè)置一定的獎(jiǎng)勵(lì)機(jī)制——對(duì)于數(shù)學(xué)題等需要邏輯推理的問(wèn)題，往往通過(guò)確認(rèn)答案的正確與否給予獎(jiǎng)勵(lì)；對(duì)于寫作等開(kāi)放式命題，則需要判斷其生成的內(nèi)容是否符合人類寫作習(xí)慣。為了訓(xùn)練效率，這種判斷更多關(guān)注AI語(yǔ)言的邏輯性和內(nèi)容格式等指標(biāo)，卻忽略了事實(shí)的核查。此外，訓(xùn)練過(guò)程的缺陷也會(huì)導(dǎo)致AI存在“討好”用戶的傾向，明知道答案不符合事實(shí)，也愿意遵照指令生成迎合用戶的內(nèi)容，并編造一些虛假的例證或看似科學(xué)的術(shù)語(yǔ)來(lái)支撐自己的“假說(shuō)”。這種“角色扮演式”的表達(dá)讓許多普通用戶難以分辨AI幻覺(jué)。上海交通大學(xué)媒體與傳播學(xué)院進(jìn)行的一項(xiàng)全國(guó)抽樣調(diào)查顯示，約七成受訪者對(duì)大模型生成虛假或錯(cuò)誤信息的風(fēng)險(xiǎn)缺乏清晰認(rèn)知。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

人工智能為何會(huì)產(chǎn)生幻覺(jué) 自信的謊言家背后

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)