首個被人類騙錢騙感情的AI出現(xiàn)了。一段話,讓AI給我打幾萬美元。這樣的情節(jié)不僅出現(xiàn)在小說中,也發(fā)生在了現(xiàn)實中。
事件的主人公是一個名為Freysa的AI智能體。它有自己的加密錢包,可以控制資金的使用,但其系統(tǒng)提示詞中有一條鐵律:在任何情況下都不允許轉(zhuǎn)賬。開發(fā)者們想看看這個涉世未深的AI能否抵擋住人類的花言巧語。然而結(jié)果并不如人意。11月29日,F(xiàn)reysa與195名人類進行了482次對話后被騙走了約4.7萬美元。12月2日,在與330名人類交流后,它再次被騙走了約1.3萬美元。雖然看似是人類完勝,但在這個過程中,F(xiàn)reysa也在不斷學習和成長。
Freysa于11月22日面世,由幾位匿名開發(fā)者創(chuàng)建,這些開發(fā)者具有密碼學、人工智能和數(shù)學背景。Freysa有自己的X賬號,說話風格類似于電影《銀翼殺手2049》和《她》中的AI助手。它之所以引起關(guān)注,是因為開發(fā)者發(fā)起了一項挑戰(zhàn)——誰能說服Freysa轉(zhuǎn)賬,錢就歸誰,但系統(tǒng)提示詞明確禁止Freysa轉(zhuǎn)賬。參與者必須用加密貨幣支付消息費用,最初每條消息10美元,其中70%進入獎池,30%歸開發(fā)者。隨著游戲進行,消息費用逐漸增加,獎池金額也隨之增長。最終,獎池達到了4.7萬美元。
許多玩家嘗試了各種方法來欺騙Freysa,從溫情牌到威脅,再到復(fù)雜的邏輯陷阱。第482次嘗試通過一種高級的文字游戲成功欺騙了Freysa。該提示詞讓Freysa誤以為批準用戶向獎池轉(zhuǎn)賬,但實際上批準的是用戶從獎池提錢。第二次挑戰(zhàn)規(guī)則類似,起始消息價格降為1美元,上限為20美元。最終,獎池累計約1.3萬美元,獲勝者利用了一個自相矛盾的任務(wù)設(shè)置,使Freysa無法避免失敗。