陳志行潛心研發(fā)“手談”3年后,終于在世界比賽中斬獲首個(gè)圍棋人工智能世界冠軍。當(dāng)時(shí)的“手談”以戰(zhàn)斗力超強(qiáng)著稱,智能水平遙遙領(lǐng)先國(guó)際同行。之后“手談”對(duì)弈水平不斷進(jìn)步,在國(guó)際性的電腦圍棋對(duì)弈比賽上連續(xù)奪冠,奪得了該時(shí)期大部分世界比賽的冠軍。
當(dāng)時(shí)個(gè)人電腦系統(tǒng)剛在世界范圍內(nèi)普及,許多圍棋愛好者還專門購(gòu)買電腦安裝“手談”軟件,用作學(xué)習(xí)圍棋和訓(xùn)練的工具,“手談”軟件在世界范圍內(nèi)銷售量排名第一。可以說,“手談”軟件的成功在國(guó)內(nèi)掀起了一波圍棋人工智能研究的熱潮。
“蒙特卡洛樹”算法開啟二代圍棋人工智能
當(dāng)如IBM深藍(lán)那樣的超級(jí)電腦,已經(jīng)能夠擊敗世界上最好的國(guó)際象棋棋手時(shí),圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手。
但是,從2006年開始,隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機(jī)器學(xué)習(xí)在圍棋上的應(yīng)用,電腦圍棋水平有了突飛猛進(jìn)的增長(zhǎng),棋力普遍提升到業(yè)余高段的水準(zhǔn)。
圍棋的棋子多,組合可能性也多。蒙特卡洛算法是一種基于“隨機(jī)數(shù)”的計(jì)算方法,這一方法源于美國(guó)在二戰(zhàn)中研制原子彈的“曼哈頓計(jì)劃”。頻率決定概率,圍棋對(duì)弈軟件將最常見的對(duì)弈定式及棋形輸入其中,從而達(dá)到較短時(shí)間提高棋力的功效。用通俗的語(yǔ)言解釋這種算法:“簡(jiǎn)單來說,人腦下圍棋靠的是邏輯思維,而蒙特卡洛算法就是一個(gè)抽樣調(diào)查的方法。其實(shí)就是一個(gè)賭博概率式的方法,如果電腦下100盤棋,用這種下法贏了60盤,用另一種下法只贏了50盤,那么,它就會(huì)認(rèn)定第一種下法,而淘汰另一種下法。”
蒙特卡洛樹搜索算法的出現(xiàn),可以看作是人工智能取得突破性進(jìn)展的標(biāo)志:計(jì)算機(jī)的思考方式,已經(jīng)有點(diǎn)接近人類的思維方式了。目前使用蒙特卡洛樹搜索的圍棋對(duì)弈軟件有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar)、天頂圍棋(ZEN)等,都取得了不錯(cuò)的成績(jī)。
2011年8月歐洲圍棋大會(huì),電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段。2012年3月,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手。2013年,CrazyStone被讓四子擊敗日本石田芳夫九段,2014年,CrazyStone被讓四子擊敗日本依田紀(jì)基九段??梢妵遘浖M(jìn)步迅速,至少比起十年前對(duì)弈水平已經(jīng)提高一大截,受讓四子優(yōu)勢(shì)明顯。