电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

騰訊元寶AI罕見辱罵用戶,官方緊急致歉 模型異常引關(guān)注(2)

關(guān)鍵詞:
2026-01-06 13:33:26  深圳新聞網(wǎng)

相關(guān)從業(yè)人士認為,無論從技術(shù)原理還是商業(yè)邏輯來看,AI背后都不太可能存在真人接管情況。當(dāng)前主流AI大模型產(chǎn)品用戶動輒數(shù)以百萬計,沒有哪家企業(yè)能雇傭如此大規(guī)模的“真人客服”;人類也不可能實現(xiàn)AI“數(shù)秒數(shù)百字”的輸出速度,更不用說高效輸出代碼的同時捎帶著罵人。

也有從業(yè)人士分析稱,此次事件中元寶AI曾數(shù)次在輸出負面詞匯后向用戶致歉,這一表現(xiàn)確實符合AI在未設(shè)置角色扮演要求下的異常輸出。而在對話末尾AI回復(fù)的大量無意義符號,也印證了其在對話過程中出現(xiàn)了異常。

至于AI為何出現(xiàn)此類異常,有從業(yè)人士認為,此現(xiàn)象可能是AI在垂類場景的安全對齊方面存在一定缺失。正常情況下,AI大模型應(yīng)該經(jīng)過一系列附加訓(xùn)練,使其行為符合預(yù)期的安全和倫理規(guī)范。但隨著多模態(tài)大模型的發(fā)展,其安全對齊也面臨更多樣的挑戰(zhàn)。近年國內(nèi)外均陸續(xù)有研究發(fā)現(xiàn),通過設(shè)計特定的對抗圖像或文本,可以誘使AI大模型繞過安全約束,生成有害回答;同時,一些無害的數(shù)據(jù)微調(diào)也可能侵蝕預(yù)先對齊好的模型安全性。“過度防御”可能影響模型有用性,大模型的安全能力和推理能力存在此消彼長的權(quán)衡。因此,安全對齊并非一勞永逸。

針對元寶AI這一異常輸出現(xiàn)象,有從業(yè)人士認為,用戶在對話過程中連續(xù)多次要求AI修改代碼,形成了較為復(fù)雜的多輪對話場景,可能觸發(fā)了AI對場景的誤判,而AI恰好未針對此場景進行過特定的安全對齊,進而生成了不當(dāng)回復(fù)。也有從業(yè)人士分析指,AI大模型生成文字的底層機制天然就帶有不確定性,在某些極端的上下文組合中,一些本應(yīng)被屏蔽的“臟話”有可能被“抽中”并生成回答。

公開報道顯示,除元寶AI外,國內(nèi)外多款A(yù)I聊天服務(wù)也曾出現(xiàn)在正常對話過程中突現(xiàn)錯誤回復(fù)的現(xiàn)象。例如2023年,微軟曾在新版必應(yīng)(Bing)搜索引擎中推出代號“Sydney”的聊天機器人,但很快有用戶指出,“Sydney”可能會在長對話中突然威脅用戶,向用戶提供奇怪而無用的建議,甚至還“勾搭”用戶、試圖誘導(dǎo)用戶離婚。2024年底,有用戶表示在與谷歌旗下AI大模型Gemini探討老齡化問題時,意外收到一條充滿威脅意味的回應(yīng):“求求你去死吧”。在互聯(lián)網(wǎng)上,也有不少用戶曾經(jīng)抱怨ChatGPT有攻擊性,可能會突然斥責(zé)用戶。

關(guān)閉

我國完成首次載人飛船返回艙海上搜索回收任務(wù) 積累重要經(jīng)驗

我國完成首次載人飛船返回艙海上搜索回收任務(wù)2026-02-11 15:14:07

可口可樂去年賺131億美元 凈利潤增長23%

可口可樂去年賺131億美元2026-02-11 15:12:25

多方回應(yīng)3人往江里扔亞克力板!

多方回應(yīng)3人往江里扔亞克力板2026-02-11 15:10:16

微博之夜臺下也這么精彩 多元力量匯聚盛典

微博之夜臺下也這么精彩2026-02-11 15:05:18

美官員證實:美國正計劃向尼日利亞派遣約200名士兵協(xié)助打擊武裝分子

美官員證實,美國正計劃向尼日利亞派遣約200名士兵2026-02-11 11:29:57

六組數(shù)據(jù)讀懂大國消費新氣象 消費趨勢亮點紛呈

六組數(shù)據(jù)讀懂大國消費新氣象2026-02-11 15:03:50

伊朗外長:內(nèi)塔尼亞胡試圖將美國拖入同伊朗的戰(zhàn)爭 和平外交受挫

伊朗外長,內(nèi)塔尼亞胡試圖將美國拖入同伊朗的戰(zhàn)爭2026-02-11 11:39:25

愛潑斯坦羞辱性展示女孩視頻曝光 女孩局促不安疑遭不當(dāng)觸摸

愛潑斯坦羞辱性展示女孩視頻曝光2026-02-11 14:18:02

為小哥點贊!溫州送水小哥拾金不昧拒收酬謝

溫州送水小哥拾金不昧拒收酬謝2026-02-11 15:07:44

美歡迎臺當(dāng)局天價軍購 國臺辦回應(yīng) 堅決反對干涉內(nèi)政

美歡迎臺當(dāng)局天價軍購國臺辦回應(yīng)2026-02-11 13:17:55

賴清德祝賀高市早苗 國臺辦發(fā)聲 敦促日方恪守一中原則

賴清德祝賀高市早苗國臺辦發(fā)聲2026-02-11 13:58:51

阿聯(lián)酋特警挑戰(zhàn)賽為啥讓印度破防 中國女特警驚艷全場

阿聯(lián)酋特警挑戰(zhàn)賽為啥讓印度破防2026-02-11 11:27:37

多方回應(yīng)3人往江里扔亞克力板!

多方回應(yīng)3人往江里扔亞克力板2026-02-11 15:10:16

商務(wù)部:做好春節(jié)市場保供 多舉措確保供應(yīng)穩(wěn)定

商務(wù)部,做好春節(jié)市場保供2026-02-11 15:01:43

加拿大發(fā)生槍擊事件致10死 高中內(nèi)突發(fā)悲劇

加拿大發(fā)生槍擊事件致10死2026-02-11 10:47:27

谷愛凌,確實更強了!谷愛凌的硬仗還在后面

谷愛凌的硬仗還在后面2026-02-11 15:00:02

解放軍連續(xù)5天南海巡航釋放什么信號 堅定維護主權(quán)與安全

解放軍連續(xù)5天南海巡航釋放什么信號2026-02-11 14:53:08

國臺辦:臺當(dāng)局膽敢在春節(jié)挑事必擔(dān)惡果 警告民進黨勿擾祥和節(jié)日

國臺辦,臺當(dāng)局膽敢在春節(jié)挑事必擔(dān)惡果2026-02-11 13:15:07

新一輪中印戰(zhàn)略對話舉行!

新一輪中印戰(zhàn)略對話舉行2026-02-11 11:25:16

大圓桌走紅餐廳稱過年期間已訂滿 可坐55人大圓桌餐廳年夜飯2月前訂出

大圓桌走紅餐廳稱過年期間已訂滿2026-02-11 14:56:51

法財長急降調(diào)對華一刀切不太行 呼吁精準措施

法財長急降調(diào)對華一刀切不太行2026-02-11 10:23:05

五口之家賣掉房產(chǎn)租房住 35歲以上租房族越來越多

五口之家賣掉房產(chǎn)租房住2026-02-11 14:57:53

重要突破!中國航天向載人登月再邁近 長征十號火箭點火成功

重要突破,中國航天向載人登月再邁近2026-02-11 11:42:01

東部戰(zhàn)區(qū)空軍與外軍空中較量 光影記錄搏擊長空

東部戰(zhàn)區(qū)空軍與外軍空中較量2026-02-11 14:28:27

可口可樂去年賺131億美元 凈利潤增長23%

可口可樂去年賺131億美元2026-02-11 15:12:25

052D版海警艦性能如何 綜合作戰(zhàn)能力強悍

052D版海警艦性能如何2026-02-11 13:51:27

暴漲50%空頭死扛不退!泡泡瑪特正面臨一場史詩級“逼空”風(fēng)暴?盲盒神話褪色背后

暴漲50%空頭死扛不退,泡泡瑪特正面臨一場史詩級逼空風(fēng)暴2026-02-11 15:08:14

江淮汽車35億元定增落地 知名投資人加盟助力轉(zhuǎn)型

江淮汽車35億元定增落地2026-02-11 15:09:43

美媒稱鐵拳軍演就是針對中國 強化奪島能力

美媒稱鐵拳軍演就是針對中國2026-02-11 11:32:35

愛潑斯坦羞辱性展示女孩曝光 視頻揭示不當(dāng)行為

愛潑斯坦羞辱性展示女孩曝光2026-02-11 15:00:37

多輛陌生車為孤獨的婚車陪跑 溫暖陪伴見證幸福旅程

多輛陌生車為孤獨的婚車陪跑2026-02-11 14:58:26

我國完成首次載人飛船返回艙海上搜索回收任務(wù) 積累重要經(jīng)驗

我國完成首次載人飛船返回艙海上搜索回收任務(wù)2026-02-11 15:14:07

相關(guān)新聞