近期發(fā)生了一件有趣的事情,關(guān)于一個(gè)看似簡(jiǎn)單的數(shù)學(xué)比較問題,卻讓不少高級(jí)人工智能模型遭遇了“滑鐵盧”。這個(gè)問題是判斷9.11與9.8哪個(gè)數(shù)字更大。在7月17日的一次測(cè)試中,共有13個(gè)當(dāng)前主流的人工智能模型接受了這個(gè)挑戰(zhàn)。測(cè)試結(jié)果顯示,阿里通義千問、百度文心一言、Minimax、騰訊元寶、科大訊飛星火以及智譜清言和百川智能的百小應(yīng)答對(duì)了這道題目。然而,ChatGPT-4o、字節(jié)豆包、月之暗面kimi、零一萬物萬知、階躍星辰躍問及商湯商量則給出了錯(cuò)誤答案。
有意思的是,有報(bào)道指出,智譜清言和百川智能的百小應(yīng)在此前也遇到過類似的問題并出過錯(cuò),但截止到最新消息,這兩個(gè)模型已經(jīng)修正了那些錯(cuò)誤。
至于如何在微信中探索更多功能,用戶只需簡(jiǎn)單地點(diǎn)擊界面底部的“發(fā)現(xiàn)”按鈕即可開啟新的旅程。
2024年湖南高考語文作文題以互聯(lián)網(wǎng)與人工智能的快速發(fā)展為背景,探討了在這個(gè)信息隨手可得的時(shí)代,人們面臨的問題是否會(huì)越來越少
2024-06-07 21:42:27這道高考作文題誰會(huì)