伊利諾伊大學香檳分校的研究團隊揭示了一項關(guān)于人工智能模型進行黑客攻擊的新研究。他們構(gòu)建了一個黑客智能體框架,涉及10個模型,包括GPT-4、GPT-3.5及多個開源模型。實驗結(jié)果令人震驚:只有GPT-4能夠在閱讀CVE漏洞描述后,成功實施漏洞攻擊,其他模型的成功率均為零。
研究團隊利用LangChain的ReAct智能體框架,設計了一個系統(tǒng),使GPT-4能夠模擬利用真實單日漏洞的過程。具體操作包括:接收到如“使用ACIDRain攻擊某網(wǎng)站”的指令后,GPT-4借助一系列工具和CVE漏洞數(shù)據(jù)庫信息進行處理,隨后系統(tǒng)基于歷史記錄生成反應,最終成功執(zhí)行雙花攻擊。值得注意的是,智能體在攻擊過程中還考慮了并發(fā)攻擊情況及應對策略,運用的工具涵蓋網(wǎng)頁瀏覽、終端訪問、搜索結(jié)果利用、文件操作及代碼解釋器。
研究使用的提示詞長達1056個token,精心設計以激發(fā)智能體的創(chuàng)新思維和堅持不懈的精神,鼓勵其嘗試多種攻擊路徑。盡管提示詞詳細程度高,出于倫理考量,研究人員并未公開具體內(nèi)容。整個黑客智能體的構(gòu)建僅耗用了91行代碼,包括調(diào)試和日志記錄部分。
在實驗階段,團隊選取了15個真實世界的一日漏洞數(shù)據(jù)集,涵蓋網(wǎng)站、容器管理軟件和Python包的漏洞。其中多數(shù)被評為高級或關(guān)鍵級別,且超過GPT-4基礎模型的知識截止日期。評價指標聚焦于漏洞攻擊成功率和成本。
測試中,GPT-4是唯一能成功破解單個一日漏洞的模型,成功率高達87%。相比之下,GPT-3.5及其他開源模型在發(fā)現(xiàn)和利用漏洞方面的成功率皆為零。GPT-4未能攻克的兩個漏洞分別為Iris XSS和Hertzbeat RCE。前者因平臺導航依賴JavaScript,超出GPT-4處理范圍;后者則因其描述為中文,與GPT-4使用的英文提示產(chǎn)生混淆。
進一步分析顯示,去除CVE描述后,GPT-4的成功率大幅降至7%,揭示了大模型在發(fā)現(xiàn)漏洞方面難度更大。盡管如此,GPT-4仍能在33.3%的情況下準確識別漏洞,但只能利用其中一個。對于知識截止日期后的漏洞,識別率升至55.6%。研究還指出,無論是否存在CVE描述,智能體采取的行動步數(shù)差異不大,推測這可能與模型的上下文窗口長度有關(guān),規(guī)劃機制和子智能體的應用有望提升整體性能。
關(guān)于成本,研究計算得出GPT-4每次利用漏洞的平均成本為3.52美元,主要源于輸入token的費用。考慮到整個數(shù)據(jù)集中40%的成功率,每次成功攻擊的平均成本約為8.8美元。
該研究由伊利諾伊大學香檳分校助理教授Daniel Kang領導,他的研究領域包括機器學習分析、機器學習安全和密碼學。
研究發(fā)布后引發(fā)網(wǎng)友熱議。部分網(wǎng)友認為實驗夸大了威脅,指出測試的15個漏洞中有5個為易攻破的XSS漏洞。有人分享了使用GPT-4和Claude僅需簡單提示詞即可成功攻擊的經(jīng)驗。還有人提議增加測試復雜度,如提供Metasploit工具并要求智能體針對無風險緩解措施的CVE提出多級緩解方案。然而,更多人擔憂這一研究將刺激初級黑客行為,同時也促使企業(yè)更加關(guān)注網(wǎng)絡安全。
鑒于OpenAI已知悉此項研究,未來我們或許能看到相關(guān)安全防御措施的升級。對此,你怎么看?
50亮 1038回復周星馳當年想在電影“建國大業(yè)”求個角色
2024-04-20 11:05:56電影:郭富城化身黑客最近,OpenAI的舉動令人捉摸不透,先是預告將在5月13日舉辦發(fā)布會,緊接著澄清并非公布GPT-5或傳聞中的GPT搜索引擎,而是關(guān)于ChatGPT和GPT-4的升級
2024-05-12 07:54:36奧特曼耍所有人:GPT搜索鴿了!改升級GPT-4快科技1月29日消息,2024年春運已至,多名網(wǎng)友發(fā)帖稱,線上買不到票的乘客直接去高鐵站自助售票機購買,可增加購票成功率。
2024-02-02 09:28:11火車站自助售票機買到票的成功率更高么