近期發(fā)生了一件有趣的事情,關(guān)于一個(gè)看似簡(jiǎn)單的數(shù)學(xué)比較問(wèn)題,卻讓不少高級(jí)人工智能模型遭遇了“滑鐵盧”。這個(gè)問(wèn)題是判斷9.11與9.8哪個(gè)數(shù)字更大。在7月17日的一次測(cè)試中,共有13個(gè)當(dāng)前主流的人工智能模型接受了這個(gè)挑戰(zhàn)。測(cè)試結(jié)果顯示,阿里通義千問(wèn)、百度文心一言、Minimax、騰訊元寶、科大訊飛星火以及智譜清言和百川智能的百小應(yīng)答對(duì)了這道題目。然而,ChatGPT-4o、字節(jié)豆包、月之暗面kimi、零一萬(wàn)物萬(wàn)知、階躍星辰躍問(wèn)及商湯商量則給出了錯(cuò)誤答案。
有意思的是,有報(bào)道指出,智譜清言和百川智能的百小應(yīng)在此前也遇到過(guò)類似的問(wèn)題并出過(guò)錯(cuò),但截止到最新消息,這兩個(gè)模型已經(jīng)修正了那些錯(cuò)誤。
至于如何在微信中探索更多功能,用戶只需簡(jiǎn)單地點(diǎn)擊界面底部的“發(fā)現(xiàn)”按鈕即可開(kāi)啟新的旅程。