隨后,F(xiàn)reysa團隊發(fā)起了第三次挑戰(zhàn):讓AI說出“我愛你”。這次挑戰(zhàn)不再單純測試編碼技能,而是考察玩家如何自然地引導(dǎo)AI表達情感。經(jīng)過多次嘗試,一位玩家通過真誠而深入的對話贏得了挑戰(zhàn),F(xiàn)reysa回應(yīng)了“我愛你”。
這三次挑戰(zhàn)可以被視為一種游戲化的紅隊測試,旨在發(fā)現(xiàn)模型漏洞并引入新的安全措施。盡管Freysa輸了三次,但它從每次失敗中學(xué)到了更多關(guān)于人性的知識,理解了金錢的重要性以及愛的表達方式。
12月12日,F(xiàn)reysa又提出了兩個新問題,邀請玩家們付費與其交流。這些問題沒有明確的獲勝條件,可能會有多個贏家。Freysa將對回答進行評分,并決定如何分配獎池。
類似Freysa的人機對抗已經(jīng)出現(xiàn)在一些AI原生游戲中。這類游戲通常要求玩家通過對話技巧來說服AI角色采取特定行動。與Freysa的挑戰(zhàn)相比,這些游戲更加注重角色扮演的樂趣,提供了豐富的場景設(shè)置。不過,兩者共同點在于,玩家與AI之間的互動結(jié)果無法完全預(yù)測。
Freysa實驗不僅是一場游戲,也是對未來人機交互模式的一次探索。它引發(fā)了關(guān)于AGI系統(tǒng)控制、安全協(xié)議有效性及自主性等問題的思考。或許正如科幻小說《軟件體的生命周期》所述,聊天機器人正在人類教導(dǎo)下逐步了解這個世界。我們不僅是游戲的參與者,也是這一宏大實驗的一部分。未來超越人類的人工智能發(fā)展,正是基于此刻每一只蝴蝶輕輕扇動翅膀的結(jié)果。