警惕AI數(shù)據(jù)污染沖擊安全防線筑牢數(shù)據(jù)安全底座

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-08-05 15:58:37 新浪財經(jīng)

警惕AI數(shù)據(jù)污染沖擊安全防線筑牢數(shù)據(jù)安全底座。國家安全部發(fā)布安全提示，指出人工智能訓練數(shù)據(jù)存在良莠不齊的問題，其中包括虛假信息、虛構(gòu)內(nèi)容和偏見性觀點，這導致數(shù)據(jù)源污染，給人工智能安全帶來新的挑戰(zhàn)。

數(shù)據(jù)是人工智能的基礎，與算法和算力一起構(gòu)成其三大核心要素。海量數(shù)據(jù)為AI模型提供了充足的訓練素材，使其能夠?qū)W習內(nèi)在規(guī)律和模式，實現(xiàn)語義理解、智能決策和內(nèi)容生成。高質(zhì)量的數(shù)據(jù)還能驅(qū)動人工智能性能和精度的持續(xù)優(yōu)化，促進模型迭代升級以適應新需求。

數(shù)據(jù)的數(shù)量、質(zhì)量及多樣性對AI模型至關(guān)重要。充足的數(shù)據(jù)量是充分訓練大規(guī)模模型的前提；高準確性、完整性和一致性的數(shù)據(jù)能有效避免誤導模型；多樣化數(shù)據(jù)則能提升模型應對實際復雜場景的能力。隨著數(shù)據(jù)資源日益豐富，“人工智能+”行動加速落地，促進了人工智能與經(jīng)濟社會各領(lǐng)域的深度融合，推動科技跨越式發(fā)展、產(chǎn)業(yè)優(yōu)化升級以及生產(chǎn)力整體躍升。

然而，數(shù)據(jù)一旦受到污染，可能導致模型決策失誤甚至系統(tǒng)失效，存在安全隱患。通過篡改、虛構(gòu)和重復等“數(shù)據(jù)投毒”行為產(chǎn)生的污染數(shù)據(jù)，會干擾模型在訓練階段的參數(shù)調(diào)整，削弱模型性能并降低其準確性，甚至誘發(fā)有害輸出。研究表明，即使少量虛假文本也會顯著增加有害內(nèi)容的比例。受污染的人工智能生成的虛假內(nèi)容還可能成為后續(xù)模型訓練的數(shù)據(jù)源，形成遞歸污染效應。互聯(lián)網(wǎng)上的大量低質(zhì)量及非客觀數(shù)據(jù)導致AI訓練數(shù)據(jù)集中的錯誤信息逐代累積，最終扭曲模型的認知能力。

數(shù)據(jù)污染還可能引發(fā)一系列現(xiàn)實風險，尤其在金融市場、公共安全和醫(yī)療健康等領(lǐng)域。在金融領(lǐng)域，不法分子利用AI炮制虛假信息，可能引發(fā)股價異常波動，構(gòu)成新型市場操縱風險；在公共安全領(lǐng)域，數(shù)據(jù)污染容易擾動公眾認知、誤導社會輿論，誘發(fā)社會恐慌情緒；在醫(yī)療健康領(lǐng)域，數(shù)據(jù)污染可能導致模型生成錯誤診療建議，危及患者生命安全并加劇偽科學傳播。

為筑牢人工智能數(shù)據(jù)底座，需加強源頭監(jiān)管，防范污染生成。依據(jù)相關(guān)法律法規(guī)，建立AI數(shù)據(jù)分類分級保護制度，從根本上防范污染數(shù)據(jù)的產(chǎn)生。同時，強化風險評估，確保數(shù)據(jù)在全生命周期環(huán)節(jié)的安全，并構(gòu)建人工智能安全風險分類管理體系，提高數(shù)據(jù)安全綜合保障能力。定期依據(jù)法規(guī)標準清洗修復受污數(shù)據(jù)，制定具體規(guī)則，逐步構(gòu)建模塊化、可監(jiān)測、可擴展的數(shù)據(jù)治理框架，實現(xiàn)持續(xù)管理和質(zhì)量把控。

(責任編輯：0882)

關(guān)閉

警惕AI數(shù)據(jù)污染沖擊安全防線 筑牢數(shù)據(jù)安全底座

相關(guān)新聞

今日熱點

頻道熱點

警惕AI數(shù)據(jù)污染沖擊安全防線筑牢數(shù)據(jù)安全底座