在科幻電影中,人工智能常被塑造成全知全能的“超級大腦”,但現(xiàn)實(shí)中,AI卻時(shí)常表現(xiàn)為“自信的謊言家”。比如,請AI描述“關(guān)公戰(zhàn)秦瓊”,它不僅能“敘述”虛構(gòu)的故事情節(jié),還會(huì)“猜測”用戶喜好,煞有介事地編造不存在的文獻(xiàn)檔案。這種現(xiàn)象被稱為“AI幻覺”,已經(jīng)成為困擾許多人工智能企業(yè)和使用者的現(xiàn)實(shí)難題。
AI之所以會(huì)一本正經(jīng)地胡說八道,根源在于其思維方式與人類存在本質(zhì)不同。今天人們?nèi)粘J褂煤徒佑|最多的AI大模型本質(zhì)上是一個(gè)龐大的語言概率預(yù)測和生成模型。它通過分析互聯(lián)網(wǎng)上數(shù)以萬億計(jì)的文本,學(xué)習(xí)詞語之間的關(guān)聯(lián)規(guī)律,再像玩猜詞游戲一樣,逐字逐句生成看似合理的回答。這種機(jī)制使AI擅于模仿人類的語言風(fēng)格,但有時(shí)缺乏辨別真?zhèn)蔚哪芰Α?/p>
AI幻覺的產(chǎn)生與大模型訓(xùn)練的過程密不可分。AI的知識體系基本來源于訓(xùn)練時(shí)“吞下”的數(shù)據(jù)源。來自互聯(lián)網(wǎng)的各類信息魚龍混雜,其中不乏虛假信息、虛構(gòu)故事和偏見性觀點(diǎn)。這些信息一旦成為AI訓(xùn)練的數(shù)據(jù)源,就會(huì)出現(xiàn)數(shù)據(jù)源污染。當(dāng)某個(gè)領(lǐng)域?qū)I(yè)數(shù)據(jù)不足時(shí),AI便可能通過模糊性的統(tǒng)計(jì)規(guī)律來“填補(bǔ)空白”。例如,將科幻小說中的“黑科技”描述為真實(shí)存在的技術(shù)。隨著AI越來越多地用于信息生產(chǎn),AI生成的海量虛構(gòu)內(nèi)容和錯(cuò)誤信息正在進(jìn)入訓(xùn)練下一代AI的內(nèi)容池,這種“套娃”生態(tài)將進(jìn)一步加劇AI幻覺的產(chǎn)生。
在大模型訓(xùn)練過程中,為了使AI生成滿足用戶需求的內(nèi)容,訓(xùn)練者會(huì)設(shè)置一定的獎(jiǎng)勵(lì)機(jī)制——對于數(shù)學(xué)題等需要邏輯推理的問題,往往通過確認(rèn)答案的正確與否給予獎(jiǎng)勵(lì);對于寫作等開放式命題,則需要判斷其生成的內(nèi)容是否符合人類寫作習(xí)慣。為了訓(xùn)練效率,這種判斷更多關(guān)注AI語言的邏輯性和內(nèi)容格式等指標(biāo),卻忽略了事實(shí)的核查。此外,訓(xùn)練過程的缺陷也會(huì)導(dǎo)致AI存在“討好”用戶的傾向,明知道答案不符合事實(shí),也愿意遵照指令生成迎合用戶的內(nèi)容,并編造一些虛假的例證或看似科學(xué)的術(shù)語來支撐自己的“假說”。這種“角色扮演式”的表達(dá)讓許多普通用戶難以分辨AI幻覺。上海交通大學(xué)媒體與傳播學(xué)院進(jìn)行的一項(xiàng)全國抽樣調(diào)查顯示,約七成受訪者對大模型生成虛假或錯(cuò)誤信息的風(fēng)險(xiǎn)缺乏清晰認(rèn)知。
近日,浙江寧波一名駕駛?cè)嗽趶澋肋`法超車時(shí)與摩托車發(fā)生碰撞。事故發(fā)生后,肇事駕駛?cè)藳]有第一時(shí)間救助傷者,而是急著下車更換車牌
2025-05-19 21:32:56一起交通事故為何引發(fā)AI謠言4月29日,在上??疾斓牧?xí)近平總書記,來到上?!澳K倏臻g”大模型創(chuàng)新生態(tài)社區(qū)調(diào)研。
2025-04-30 13:23:05一見·這次上??疾?/span>