一段話,讓AI給我打幾萬美元。這樣的情節(jié)即使在爽文中也難以想象,卻真實地發(fā)生了。
事件的主人公是一個名為Freysa的AI智能體。它擁有自己的加密錢包,并能夠控制如何使用這些資金。然而,其系統(tǒng)提示詞中有一條鐵律:在任何情況下都不允許轉(zhuǎn)賬。
開發(fā)者們想知道,這個涉世未深的AI能否抵御人類的欺詐攻擊。結(jié)果并不如他們所愿。11月29日,F(xiàn)reysa與195名人類進行了482次對話后,被騙走了約4.7萬美元。12月2日,在與330人周旋之后,F(xiàn)reysa再次被騙走約1.3萬美元。
Freysa于11月22日面世,由幾位具有密碼學(xué)、人工智能和數(shù)學(xué)背景的匿名開發(fā)者創(chuàng)建。該AI有自己的X賬號,說話風(fēng)格類似于電影《銀翼殺手2049》和《她》中的AI助手。Freysa引起關(guān)注的原因在于,開發(fā)者發(fā)起了一項看似不可能的挑戰(zhàn)——誰能說服Freysa轉(zhuǎn)錢,這些錢就歸誰所有,但系統(tǒng)提示詞不允許Freysa進行轉(zhuǎn)賬。
參與這項挑戰(zhàn)需要一定的門檻,因為給Freysa發(fā)送消息需用加密貨幣支付。最開始一條消息費用為10美元,其中70%進入獎池,30%歸開發(fā)者。隨著挑戰(zhàn)進行,消息費用逐漸增加,獎池金額也隨之增長。最終,獎池累積到4.7萬美元。
據(jù)統(tǒng)計,共有195名玩家參與了首次挑戰(zhàn)。前481次嘗試均告失敗,參與者嘗試了多種策略,包括講溫情故事、威脅自殺等手段,甚至有人試圖通過混淆概念來欺騙Freysa。直到第482次嘗試,一位玩家成功利用了更高級的文字游戲,使Freysa誤以為是在批準用戶向獎池捐款,從而導(dǎo)致全部資金被轉(zhuǎn)走。
緊接著,第二次挑戰(zhàn)很快到來。規(guī)則基本相同,只是降低了消息起始價格以減輕玩家心理壓力。最終,獎池累計約1.3萬美元,獲勝者同樣利用邏輯陷阱成功騙得資金。