新華社北京11月1日電? 科普:人工智能發(fā)展到了哪一步——“人工智能追問”系列報道之三
新華社記者 楊駿
年初,“阿爾法圍棋”橫掃中韓等國頂級棋手,10月它又被自己的新版算法“阿爾法圍棋-零”戰(zhàn)勝。人工智能領(lǐng)域的一系列新現(xiàn)象、新突破,讓人眼花繚亂、目不暇接。
無論是將人工智能稱作“下一個風(fēng)口”、“最強有力的創(chuàng)新加速器”、“驅(qū)動未來的動力”,還是關(guān)于它會不會比人類更聰明、甚至取代人類的爭論,都說明人工智能又一次迎來發(fā)展高潮。
與以往幾十年不同的是,人工智能這一輪高潮,是科技進步的水到渠成,也是與生活和工作相關(guān)的科技應(yīng)用快速發(fā)展的結(jié)果,被嵌入十分廣泛的生活場景中。有科學(xué)家因此認為,“我們或許將成為與人工智能真正共同生活的第一代人”。
不怕機器記性好,就怕機器會學(xué)習(xí)。像“阿爾法圍棋”這樣的機器自我學(xué)習(xí)技術(shù)基于三方面要素:互聯(lián)網(wǎng)大數(shù)據(jù)、強大的運算能力以及深度學(xué)習(xí)技術(shù)突破。它們共同造就了語音、人臉識別準確率的驚人提升,更加自然的人機對話,乃至可以像“阿爾法圍棋”一樣去找尋規(guī)律、自我決策,其中最核心的是深度學(xué)習(xí)。
那究竟什么是深度學(xué)習(xí)?一是通過算法給機器設(shè)計一個神經(jīng)網(wǎng)絡(luò);二是通過大量標定的數(shù)據(jù)樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓它認識外部世界。以前,一個應(yīng)用要通過非常精確的算法來描述,但是今天,我們不知道該用什么精確模型來教計算機,只能拿非常多的數(shù)據(jù)樣本讓機器比對學(xué)習(xí),舉一反三。
具體到“阿爾法圍棋”,它還使用了強化學(xué)習(xí)和蒙特卡洛樹搜索等技術(shù)。后者是一種啟發(fā)式的搜索策略,能夠基于對搜索空間的隨機抽樣來擴大搜索樹,從而分析圍棋這類游戲中每一步棋應(yīng)該怎么走才能夠創(chuàng)造最好機會。
只需要先教“阿爾法圍棋”一些人類摸索出的基本下法,然后讓它與自己大量對戰(zhàn),就可以飛速提升水平。而“阿爾法圍棋”的最新版本“阿爾法圍棋-零”具備了無師自通的能力,在沒有人類知識與對決訓(xùn)練的情況下,“從零開始”自己與自己對弈,僅3天后就戰(zhàn)勝了自己的前輩。