AI“手指難題”翻車暴露啥問題 模型認知局限。最近幾天,整個互聯(lián)網(wǎng)因為AI的一個小失誤陷入了討論。這個失誤發(fā)生在一項簡單的任務(wù)上:給圖中的每根手指依次標出數(shù)字。然而題目中隱藏了一個小陷阱——這只手有六個手指。Nano Banana Pro模型在執(zhí)行任務(wù)時,直接忽略了其中一根手指,只標注了1、2、3、4、5。這一荒誕的場面再次震驚了網(wǎng)友們。
有人認為AI并非真的這么傻,而是故意裝傻來調(diào)戲人類。為了通過圖靈測試,AI可能需要表現(xiàn)得稍微愚蠢一些,才能更像人類。如果太聰明,反而容易被識破。GPT-5.2也遇到了類似的問題,即使提示中明確指出圖中有六根手指,它依然堅持認為是五根,理由是人類的手應(yīng)該有五根手指。
此外,當(dāng)面對形狀奇特的手指圖像時,Nano Banana Pro仍然堅持認為是五根手指。無論怎么畫,AI始終無法數(shù)出六根手指。這讓許多網(wǎng)友感到困惑和無奈。
為了解決這個問題,網(wǎng)友們嘗試了各種方法。有人給出具體指令,讓模型把數(shù)字左移并加上第六個數(shù)字,但結(jié)果還是失敗了。最終,通過一些奇招,比如讓模型把手畫成電子版或者按順序在小指到大拇指上放數(shù)字,才成功讓AI數(shù)對了手指。
為什么AI很難數(shù)對手指?一種解釋是,AI識別的是基本形狀而非精確圖像,并將該形狀與傳統(tǒng)認知進行比較。還有人猜測,如果告訴AI這不是手而是不規(guī)則物體,或許可以規(guī)避其大腦中的偏見。這種嘗試果然成功了。這表明AI之前可能已經(jīng)被訓(xùn)練識別特定的emoji,換成其他圖像時,它可以做出正確的視覺推理。
這次事件揭示了當(dāng)前AI模型的一個關(guān)鍵缺陷——思考的機械性和割裂性。文本模型看到指令后,內(nèi)部邏輯可能是“手有五根手指,所以需要五個數(shù)字”。即使它看到了六指圖像,視覺識別能力也不足以糾正這種根深蒂固的文本認知。因為在人類手部圖像數(shù)據(jù)中,五指手占據(jù)主導(dǎo)地位,模型已經(jīng)從海量數(shù)據(jù)中學(xué)到了“人手=五指”這一強關(guān)聯(lián)。
蘋果今年秋季發(fā)布會的邀請函上寫著“驚掉下巴”,玩的是諧音梗,但其實新品信息早已被劇透得差不多了
2025-09-11 08:04:08媒體過去三年,AI 行業(yè)經(jīng)歷了快速發(fā)展。模型規(guī)模越來越大,數(shù)據(jù)中心越來越多,英偉達的股價也持續(xù)攀升
2025-11-17 07:39:15一塊GPU能撐幾年12月26日,華為第六屆奧林帕斯獎?wù)絾尤蛘骷?,獎金池?00萬元人民幣,聚焦解決AI時代的存儲難題
2025-12-26 22:05:34華為懸賞300萬元求解難題AI產(chǎn)業(yè)的迅速發(fā)展催生了巨大的算力需求,但全球算力資源利用率低的問題日益突出
2025-11-22 16:30:34Flex12月26日,華為第六屆奧林帕斯獎?wù)絾尤蛘骷?。今年繼續(xù)設(shè)立300萬元人民幣獎金池,聚焦解決AI時代的存儲難題
2025-12-27 10:44:03華為懸賞300萬元求解AI難題