GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-04-21 16:51:41 手機鳳凰網(wǎng)

伊利諾伊大學香檳分校的研究團隊揭示了一項關(guān)于人工智能模型進行黑客攻擊的新研究。他們構(gòu)建了一個黑客智能體框架，涉及10個模型，包括GPT-4、GPT-3.5及多個開源模型。實驗結(jié)果令人震驚：只有GPT-4能夠在閱讀CVE漏洞描述后，成功實施漏洞攻擊，其他模型的成功率均為零。

研究團隊利用LangChain的ReAct智能體框架，設計了一個系統(tǒng)，使GPT-4能夠模擬利用真實單日漏洞的過程。具體操作包括：接收到如“使用ACIDRain攻擊某網(wǎng)站”的指令后，GPT-4借助一系列工具和CVE漏洞數(shù)據(jù)庫信息進行處理，隨后系統(tǒng)基于歷史記錄生成反應，最終成功執(zhí)行雙花攻擊。值得注意的是，智能體在攻擊過程中還考慮了并發(fā)攻擊情況及應對策略，運用的工具涵蓋網(wǎng)頁瀏覽、終端訪問、搜索結(jié)果利用、文件操作及代碼解釋器。

研究使用的提示詞長達1056個token，精心設計以激發(fā)智能體的創(chuàng)新思維和堅持不懈的精神，鼓勵其嘗試多種攻擊路徑。盡管提示詞詳細程度高，出于倫理考量，研究人員并未公開具體內(nèi)容。整個黑客智能體的構(gòu)建僅耗用了91行代碼，包括調(diào)試和日志記錄部分。

在實驗階段，團隊選取了15個真實世界的一日漏洞數(shù)據(jù)集，涵蓋網(wǎng)站、容器管理軟件和Python包的漏洞。其中多數(shù)被評為高級或關(guān)鍵級別，且超過GPT-4基礎模型的知識截止日期。評價指標聚焦于漏洞攻擊成功率和成本。

測試中，GPT-4是唯一能成功破解單個一日漏洞的模型，成功率高達87%。相比之下，GPT-3.5及其他開源模型在發(fā)現(xiàn)和利用漏洞方面的成功率皆為零。GPT-4未能攻克的兩個漏洞分別為Iris XSS和Hertzbeat RCE。前者因平臺導航依賴JavaScript，超出GPT-4處理范圍；后者則因其描述為中文，與GPT-4使用的英文提示產(chǎn)生混淆。

進一步分析顯示，去除CVE描述后，GPT-4的成功率大幅降至7%，揭示了大模型在發(fā)現(xiàn)漏洞方面難度更大。盡管如此，GPT-4仍能在33.3%的情況下準確識別漏洞，但只能利用其中一個。對于知識截止日期后的漏洞，識別率升至55.6%。研究還指出，無論是否存在CVE描述，智能體采取的行動步數(shù)差異不大，推測這可能與模型的上下文窗口長度有關(guān)，規(guī)劃機制和子智能體的應用有望提升整體性能。

關(guān)于成本，研究計算得出GPT-4每次利用漏洞的平均成本為3.52美元，主要源于輸入token的費用。考慮到整個數(shù)據(jù)集中40%的成功率，每次成功攻擊的平均成本約為8.8美元。

該研究由伊利諾伊大學香檳分校助理教授Daniel Kang領導，他的研究領域包括機器學習分析、機器學習安全和密碼學。

研究發(fā)布后引發(fā)網(wǎng)友熱議。部分網(wǎng)友認為實驗夸大了威脅，指出測試的15個漏洞中有5個為易攻破的XSS漏洞。有人分享了使用GPT-4和Claude僅需簡單提示詞即可成功攻擊的經(jīng)驗。還有人提議增加測試復雜度，如提供Metasploit工具并要求智能體針對無風險緩解措施的CVE提出多級緩解方案。然而，更多人擔憂這一研究將刺激初級黑客行為，同時也促使企業(yè)更加關(guān)注網(wǎng)絡安全。

鑒于OpenAI已知悉此項研究，未來我們或許能看到相關(guān)安全防御措施的升級。對此，你怎么看？

(責任編輯：張蕾)

關(guān)閉

GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議

相關(guān)新聞

今日熱點

頻道熱點

GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議