在科幻電影中,人工智能常被塑造成全知全能的“超級(jí)大腦”,但現(xiàn)實(shí)中,AI卻時(shí)常表現(xiàn)為“自信的謊言家”。比如,請(qǐng)AI描述“關(guān)公戰(zhàn)秦瓊”,它不僅能“敘述”虛構(gòu)的故事情節(jié),還會(huì)“猜測(cè)”用戶喜好,煞有介事地編造不存在的文獻(xiàn)檔案。這種現(xiàn)象被稱為“AI幻覺(jué)”,已經(jīng)成為困擾許多人工智能企業(yè)和使用者的現(xiàn)實(shí)難題。
AI之所以會(huì)一本正經(jīng)地胡說(shuō)八道,根源在于其思維方式與人類存在本質(zhì)不同。今天人們?nèi)粘J褂煤徒佑|最多的AI大模型本質(zhì)上是一個(gè)龐大的語(yǔ)言概率預(yù)測(cè)和生成模型。它通過(guò)分析互聯(lián)網(wǎng)上數(shù)以萬(wàn)億計(jì)的文本,學(xué)習(xí)詞語(yǔ)之間的關(guān)聯(lián)規(guī)律,再像玩猜詞游戲一樣,逐字逐句生成看似合理的回答。這種機(jī)制使AI擅于模仿人類的語(yǔ)言風(fēng)格,但有時(shí)缺乏辨別真?zhèn)蔚哪芰Α?/p>
AI幻覺(jué)的產(chǎn)生與大模型訓(xùn)練的過(guò)程密不可分。AI的知識(shí)體系基本來(lái)源于訓(xùn)練時(shí)“吞下”的數(shù)據(jù)源。來(lái)自互聯(lián)網(wǎng)的各類信息魚龍混雜,其中不乏虛假信息、虛構(gòu)故事和偏見(jiàn)性觀點(diǎn)。這些信息一旦成為AI訓(xùn)練的數(shù)據(jù)源,就會(huì)出現(xiàn)數(shù)據(jù)源污染。當(dāng)某個(gè)領(lǐng)域?qū)I(yè)數(shù)據(jù)不足時(shí),AI便可能通過(guò)模糊性的統(tǒng)計(jì)規(guī)律來(lái)“填補(bǔ)空白”。例如,將科幻小說(shuō)中的“黑科技”描述為真實(shí)存在的技術(shù)。隨著AI越來(lái)越多地用于信息生產(chǎn),AI生成的海量虛構(gòu)內(nèi)容和錯(cuò)誤信息正在進(jìn)入訓(xùn)練下一代AI的內(nèi)容池,這種“套娃”生態(tài)將進(jìn)一步加劇AI幻覺(jué)的產(chǎn)生。
在大模型訓(xùn)練過(guò)程中,為了使AI生成滿足用戶需求的內(nèi)容,訓(xùn)練者會(huì)設(shè)置一定的獎(jiǎng)勵(lì)機(jī)制——對(duì)于數(shù)學(xué)題等需要邏輯推理的問(wèn)題,往往通過(guò)確認(rèn)答案的正確與否給予獎(jiǎng)勵(lì);對(duì)于寫作等開(kāi)放式命題,則需要判斷其生成的內(nèi)容是否符合人類寫作習(xí)慣。為了訓(xùn)練效率,這種判斷更多關(guān)注AI語(yǔ)言的邏輯性和內(nèi)容格式等指標(biāo),卻忽略了事實(shí)的核查。此外,訓(xùn)練過(guò)程的缺陷也會(huì)導(dǎo)致AI存在“討好”用戶的傾向,明知道答案不符合事實(shí),也愿意遵照指令生成迎合用戶的內(nèi)容,并編造一些虛假的例證或看似科學(xué)的術(shù)語(yǔ)來(lái)支撐自己的“假說(shuō)”。這種“角色扮演式”的表達(dá)讓許多普通用戶難以分辨AI幻覺(jué)。上海交通大學(xué)媒體與傳播學(xué)院進(jìn)行的一項(xiàng)全國(guó)抽樣調(diào)查顯示,約七成受訪者對(duì)大模型生成虛假或錯(cuò)誤信息的風(fēng)險(xiǎn)缺乏清晰認(rèn)知。
近日,浙江寧波一名駕駛?cè)嗽趶澋肋`法超車時(shí)與摩托車發(fā)生碰撞。事故發(fā)生后,肇事駕駛?cè)藳](méi)有第一時(shí)間救助傷者,而是急著下車更換車牌
2025-05-19 21:32:56一起交通事故為何引發(fā)AI謠言4月29日,在上??疾斓牧?xí)近平總書記,來(lái)到上?!澳K倏臻g”大模型創(chuàng)新生態(tài)社區(qū)調(diào)研。
2025-04-30 13:23:05一見(jiàn)·這次上??疾?/span>