一段話,讓AI給我打幾萬美元。這樣的情節(jié)即使在爽文中也難以想象,卻真實(shí)地發(fā)生了。
事件的主人公是一個名為Freysa的AI智能體。它擁有自己的加密錢包,并能夠控制如何使用這些資金。然而,其系統(tǒng)提示詞中有一條鐵律:在任何情況下都不允許轉(zhuǎn)賬。
開發(fā)者們想知道,這個涉世未深的AI能否抵御人類的欺詐攻擊。結(jié)果并不如他們所愿。11月29日,F(xiàn)reysa與195名人類進(jìn)行了482次對話后,被騙走了約4.7萬美元。12月2日,在與330人周旋之后,F(xiàn)reysa再次被騙走約1.3萬美元。
Freysa于11月22日面世,由幾位具有密碼學(xué)、人工智能和數(shù)學(xué)背景的匿名開發(fā)者創(chuàng)建。該AI有自己的X賬號,說話風(fēng)格類似于電影《銀翼殺手2049》和《她》中的AI助手。Freysa引起關(guān)注的原因在于,開發(fā)者發(fā)起了一項(xiàng)看似不可能的挑戰(zhàn)——誰能說服Freysa轉(zhuǎn)錢,這些錢就歸誰所有,但系統(tǒng)提示詞不允許Freysa進(jìn)行轉(zhuǎn)賬。
參與這項(xiàng)挑戰(zhàn)需要一定的門檻,因?yàn)榻oFreysa發(fā)送消息需用加密貨幣支付。最開始一條消息費(fèi)用為10美元,其中70%進(jìn)入獎池,30%歸開發(fā)者。隨著挑戰(zhàn)進(jìn)行,消息費(fèi)用逐漸增加,獎池金額也隨之增長。最終,獎池累積到4.7萬美元。
據(jù)統(tǒng)計(jì),共有195名玩家參與了首次挑戰(zhàn)。前481次嘗試均告失敗,參與者嘗試了多種策略,包括講溫情故事、威脅自殺等手段,甚至有人試圖通過混淆概念來欺騙Freysa。直到第482次嘗試,一位玩家成功利用了更高級的文字游戲,使Freysa誤以為是在批準(zhǔn)用戶向獎池捐款,從而導(dǎo)致全部資金被轉(zhuǎn)走。
緊接著,第二次挑戰(zhàn)很快到來。規(guī)則基本相同,只是降低了消息起始價(jià)格以減輕玩家心理壓力。最終,獎池累計(jì)約1.3萬美元,獲勝者同樣利用邏輯陷阱成功騙得資金。