人工智能已深度融入經(jīng)濟社會發(fā)展的方方面面,深刻改變了人類的生產(chǎn)生活方式,成為關(guān)乎高質(zhì)量發(fā)展和高水平安全的關(guān)鍵領(lǐng)域。然而,訓(xùn)練數(shù)據(jù)存在良莠不齊的問題,其中不乏虛假信息、虛構(gòu)內(nèi)容和偏見性觀點,造成數(shù)據(jù)源污染,給人工智能安全帶來新的挑戰(zhàn)。
高質(zhì)量的數(shù)據(jù)能夠顯著提升模型的準(zhǔn)確性和可靠性,但數(shù)據(jù)一旦受到污染,則可能導(dǎo)致模型決策失誤甚至AI系統(tǒng)失效,存在一定的安全隱患。通過篡改、虛構(gòu)和重復(fù)等“數(shù)據(jù)投毒”行為產(chǎn)生的污染數(shù)據(jù)會干擾模型在訓(xùn)練階段的參數(shù)調(diào)整,削弱模型性能、降低其準(zhǔn)確性,甚至誘發(fā)有害輸出。研究表明,當(dāng)訓(xùn)練數(shù)據(jù)集中僅有0.01%的虛假文本時,模型輸出的有害內(nèi)容會增加11.2%;即使是0.001%的虛假文本,其有害輸出也會相應(yīng)上升7.2%。
受到數(shù)據(jù)污染的人工智能生成的虛假內(nèi)容可能成為后續(xù)模型訓(xùn)練的數(shù)據(jù)源,形成具有延續(xù)性的“污染遺留效應(yīng)”。當(dāng)前,互聯(lián)網(wǎng)AI生成內(nèi)容在數(shù)量上已遠(yuǎn)超人類生產(chǎn)的真實內(nèi)容,大量低質(zhì)量及非客觀數(shù)據(jù)充斥其中,導(dǎo)致AI訓(xùn)練數(shù)據(jù)集中的錯誤信息逐代累積,最終扭曲模型本身的認(rèn)知能力。數(shù)據(jù)污染還可能引發(fā)一系列現(xiàn)實風(fēng)險,尤其在金融市場、公共安全和醫(yī)療健康等領(lǐng)域。在金融領(lǐng)域,不法分子利用AI炮制虛假信息,造成數(shù)據(jù)污染,可能引發(fā)股價異常波動,構(gòu)成新型市場操縱風(fēng)險;在公共安全領(lǐng)域,數(shù)據(jù)污染容易擾動公眾認(rèn)知、誤導(dǎo)社會輿論,誘發(fā)社會恐慌情緒;在醫(yī)療健康領(lǐng)域,數(shù)據(jù)污染則可能致使模型生成錯誤診療建議,不僅危及患者生命安全,也加劇偽科學(xué)的傳播。
加強源頭監(jiān)管,防范污染生成。以《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護法》等法律法規(guī)為依據(jù),建立AI數(shù)據(jù)分類分級保護制度,從根本上防范污染數(shù)據(jù)的產(chǎn)生,助力有效防范AI數(shù)據(jù)安全威脅。強化風(fēng)險評估,保障數(shù)據(jù)流通。加強對人工智能數(shù)據(jù)安全風(fēng)險的整體評估,確保數(shù)據(jù)在采集、存儲、傳輸、使用、交換和備份等全生命周期環(huán)節(jié)安全。同步加快構(gòu)建人工智能安全風(fēng)險分類管理體系,不斷提高數(shù)據(jù)安全綜合保障能力。末端清洗修復(fù),構(gòu)建治理框架。定期依據(jù)法規(guī)標(biāo)準(zhǔn)清洗修復(fù)受污數(shù)據(jù),制定數(shù)據(jù)清洗的具體規(guī)則,逐步構(gòu)建模塊化、可監(jiān)測、可擴展的數(shù)據(jù)治理框架,實現(xiàn)持續(xù)管理與質(zhì)量把控。
國家安全部今天(22日)發(fā)布安全提示文章。暑期長假已至,出境旅游迎來高峰期。境外觀光,游客多樂于選購富有當(dāng)?shù)靥厣募o(jì)念品,珍藏旅途記憶。
2025-07-22 07:40:16國安部發(fā)布出境旅游安全提示國安部:連續(xù)破獲臺灣間諜竊密案件,打掉一批間諜情報網(wǎng)絡(luò)2024年6月21日
2025-06-28 09:10:14國安部:連續(xù)破獲臺灣間諜竊密案件近年來,境外間諜情報機關(guān)對我實施的網(wǎng)絡(luò)攻擊竊密活動愈演愈烈,手段層出不窮,對國家安全構(gòu)成嚴(yán)重威脅,需引起高度重視。國家安全部披露了三起典型案例
2025-06-05 08:23:24國安部公布重大泄密事件今天,國家安全部發(fā)文提醒:“斷舍離”不能把這些寶貝丟了!垃圾桶內(nèi)值“千金”。接群眾舉報,某單位門口的垃圾桶內(nèi)有大量疑似涉密圖紙資料
2025-06-14 01:22:27國安部