Hinton:我的直覺(jué)告訴我,模型規(guī)模擴(kuò)大后,推理能力也能提升。
人們?nèi)绾喂ぷ??大致?lái)說(shuō),人類有直覺(jué)進(jìn)行推理,再用推理來(lái)糾正我們的直覺(jué)。當(dāng)然,在推理過(guò)程中也會(huì)使用直覺(jué)。假設(shè)推理的結(jié)論與直覺(jué)沖突,我們就會(huì)意識(shí)到需要糾正直覺(jué)。
這與AlphaGo或AlphaZero的工作方式類似,它們有一個(gè)評(píng)估函數(shù),只需看一眼棋盤,然后判斷“這對(duì)我來(lái)說(shuō)有多好?”但是,進(jìn)行蒙特卡羅推演時(shí),你會(huì)得到一個(gè)更準(zhǔn)確的想法,你可以修改你的評(píng)估函數(shù)。因此,通過(guò)讓模型接受推理的結(jié)果,來(lái)對(duì)模型進(jìn)行訓(xùn)練。
大語(yǔ)言模型必須開(kāi)始這樣做,必須開(kāi)始通過(guò)推理,來(lái)訓(xùn)練模型的直覺(jué),知道下一步做什么,并意識(shí)到什么是不對(duì)的。這樣,他們就可以獲得更多的訓(xùn)練數(shù)據(jù),而不僅僅是模仿人類。這正是AlphaGo能夠做出第37步妙棋的原因,它擁有更多的訓(xùn)練數(shù)據(jù),因?yàn)樗褂猛评韥?lái)檢查下一步應(yīng)該是什么。
多模態(tài)讓模型學(xué)習(xí)更加容易,同時(shí)利于空間推理
主持人:你對(duì)多模態(tài)有何看法?我們談到了這些類比,而這些類比往往遠(yuǎn)遠(yuǎn)超出了我們所能看到的范圍。模型發(fā)現(xiàn)的類比遠(yuǎn)遠(yuǎn)超出了人類的能力,可能是在我們永遠(yuǎn)無(wú)法理解的抽象層面上?,F(xiàn)在,當(dāng)我們將圖像、視頻和聲音引入其中時(shí),你認(rèn)為這會(huì)如何改變模型?你認(rèn)為它將如何改變,它能夠進(jìn)行的類比?
Hinton:這將帶來(lái)很大的改變。例如,它將使模型更好地理解空間事物。僅從語(yǔ)言角度來(lái)看,很難理解一些空間事物。盡管值得注意的是,即使在成為多模態(tài)之前,GPT-4也能做到這一點(diǎn)。但是,當(dāng)你讓模型成為多模態(tài)時(shí),如果你讓它既能做視覺(jué),又能伸手抓東西,它能拿起物體并翻轉(zhuǎn)它們等等,它就會(huì)更好地理解物體。因此,雖然可以從語(yǔ)言中學(xué)到很多東西,但如果是多模態(tài),學(xué)習(xí)起來(lái)會(huì)更容易。事實(shí)上,需要的語(yǔ)言更少。