电竞下注-中国电竞赛事及体育赛事平台

當(dāng)前位置:新聞 > 滾動(dòng) > 正文

AI碾壓星際爭(zhēng)霸2:AI玩家在連續(xù)10局中反復(fù)擊敗人類(lèi)

2019-01-25 15:44:43  北晚新視覺(jué)    參與評(píng)論()人

原標(biāo)題:AI碾壓星際爭(zhēng)霸2 網(wǎng)友:人工智能玩游戲有樂(lè)趣可言嗎?

谷歌旗下DeepMind開(kāi)發(fā)的人工智能AIphaStar在《星際爭(zhēng)霸2》(Starcraft II)中擊敗了兩位人類(lèi)職業(yè)玩家,這是AI領(lǐng)域的新里程碑。在YouTube和Twitch上播放的比賽中,AI玩家在連續(xù)10局中反復(fù)擊敗人類(lèi)。而在最后的對(duì)決中,職業(yè)選手格里戈?duì)柶潯ぁ奥取薄た泼髌潱℅rzegorz “MaNa” Komincz)為人類(lèi)贏得了唯一的勝利。

AI碾壓星際爭(zhēng)霸2:AI玩家在連續(xù)10局中反復(fù)擊敗人類(lèi)

去年12月份的比賽截圖顯示,AlphaStar與人類(lèi)玩家TLO的對(duì)決

相比人類(lèi)玩家,AI的優(yōu)劣勢(shì)很明顯

與兄弟AI AIphago登頂?shù)膰逅煌氖牵缎请H爭(zhēng)霸2》是不完美信息系統(tǒng),有著阻礙信息順利獲取的戰(zhàn)爭(zhēng)迷霧,除此之外,操作的單位數(shù)量和頻率較大,且存在多線(xiàn)作戰(zhàn),需要同時(shí)兼顧后方經(jīng)營(yíng),和前方多線(xiàn)戰(zhàn)事。顯然,在多線(xiàn)決策方面AI的優(yōu)勢(shì)要比線(xiàn)性思維的人類(lèi)要大得多。

DeepMind的研究聯(lián)席負(fù)責(zé)人戴維·西爾弗(David Silver)在賽后表示:“AI的歷史被打上了許多重大的、標(biāo)桿性勝利的印記。盡管還有很多工作要做,但我希望未來(lái)的人們?cè)诨仡?今天)時(shí),認(rèn)為這是AI系統(tǒng)向前邁進(jìn)了一步的象征?!?/p>

在視頻游戲里擊敗人類(lèi)玩家似乎是AI開(kāi)發(fā)過(guò)程中的一個(gè)小插曲,但這也是一個(gè)重大的研究挑戰(zhàn)?!缎请H爭(zhēng)霸2》這樣的游戲比圍棋之類(lèi)棋盤(pán)游戲更難玩。在視頻游戲中,AI無(wú)法通過(guò)觀察每個(gè)棋子的移動(dòng)來(lái)計(jì)算下一步棋,它們必須實(shí)時(shí)做出反應(yīng)。

這些因素似乎對(duì)DeepMind被稱(chēng)為AlphaStar的AI系統(tǒng)并未構(gòu)成多大障礙。首先,它打敗了人類(lèi)職業(yè)玩家達(dá)里奧·溫什(Dario Wunsch,即TLO),然后將目標(biāo)對(duì)準(zhǔn)MaNa。這些比賽最初是于去年12月份在DeepMind的倫敦總部舉行的,但該公司今天播放了AlphaStar與MaNa的最后一場(chǎng)比賽,這是人類(lèi)玩家唯一獲勝的比賽。

《星際爭(zhēng)霸》的職業(yè)評(píng)論員形容AlphaStar的表現(xiàn)是“非凡的”、“超人的”。在《星際爭(zhēng)霸2》中,玩家在建立基地、訓(xùn)練軍隊(duì)和入侵?jǐn)橙祟I(lǐng)土之前,會(huì)從相同地圖的不同側(cè)面展開(kāi)行動(dòng)。AlphaStar尤其擅長(zhǎng)所謂的“微操”,即在戰(zhàn)場(chǎng)上快速、果斷地控制單個(gè)或少量部隊(duì)的能力。

盡管人類(lèi)玩家有時(shí)能夠訓(xùn)練出更強(qiáng)大的作戰(zhàn)單位,但AlphaZero還是能夠在近距離內(nèi)戰(zhàn)勝他們。在一場(chǎng)游戲中,AlphaStar用名為Stalker的快速移動(dòng)單位騷擾MaNa。評(píng)論員凱文·范德庫(kù)伊(Kevin van der Kooi)將其描述為“非凡的單位控制能力,很不常見(jiàn)”。MaNa在賽后表示:“如果我和任何人類(lèi)比賽,他們都不會(huì)將Stalker運(yùn)用得如此出神入化?!?/p>

這與我們?cè)谄渌呒?jí)游戲AI中看到的行為相呼應(yīng)。當(dāng)OpenAI去年在《Dota 2》中與人類(lèi)職業(yè)選手對(duì)決時(shí),它們最后以失敗告終。但專(zhuān)家們指出,這些AI是以一種“清晰而精確”的方式進(jìn)行著游戲。對(duì)此,我們無(wú)需感到奇怪,快速做出沒(méi)有任何錯(cuò)誤的決定是機(jī)器的天賦異能。

專(zhuān)家們已經(jīng)開(kāi)始仔細(xì)分析這些比賽,并就AlphaStar是否擁有任何不公平的優(yōu)勢(shì)展開(kāi)辯論。這些AI在某些方面依然顯得笨拙,例如,AlphaStar的每分鐘點(diǎn)擊依然比人類(lèi)低。但與人類(lèi)玩家不同的是,它每次都能夠查看整個(gè)地圖,而不是手動(dòng)導(dǎo)航。

DeepMind的研究人員表示,這并沒(méi)有為AlphaStar提供真正的優(yōu)勢(shì),因?yàn)樗谌魏螘r(shí)間只關(guān)注地圖的某個(gè)特定部分。但是,正如比賽所顯示的那樣,這并沒(méi)有阻止AlphaStar同時(shí)熟練地控制三個(gè)不同區(qū)域的單位。評(píng)論員們表示,這對(duì)人類(lèi)來(lái)說(shuō)是不可能的。值得注意的是,當(dāng)MaNa在直播比賽中擊敗AlphaStar時(shí),AI使用的是受限的攝像頭視角。

AlphaStar的另一個(gè)潛在痛點(diǎn)是,人類(lèi)玩家雖然是職業(yè)玩家,但卻不是世界冠軍的標(biāo)準(zhǔn)。TLO還必須扮演《星際爭(zhēng)霸2》中他不熟悉的三個(gè)種族之一。

AI的重大進(jìn)步?

撇開(kāi)這些不談,專(zhuān)家們稱(chēng)這場(chǎng)比賽是AI向前邁出的重要一步。長(zhǎng)期參與《星際爭(zhēng)霸》AI場(chǎng)景的AI研究人員戴夫·丘吉爾(Dave Churchill)表示:“我認(rèn)為AI取得了重大成就,至少比我在AI研究人員中聽(tīng)到的最樂(lè)觀猜測(cè)提前了一年?!比欢窦獱栄a(bǔ)充說(shuō),由于DeepMind尚未發(fā)布任何關(guān)于這項(xiàng)工作的研究論文,因此很難說(shuō)它是否顯示出任何技術(shù)上的飛躍。他指出:“我還沒(méi)有讀過(guò)這篇博客文章,也沒(méi)有接觸過(guò)相關(guān)的論文或技術(shù)細(xì)節(jié)?!?/p>

佐治亞理工學(xué)院AI副教授馬克·里德?tīng)?Mark Riedl)表示,他對(duì)結(jié)果并不那么驚訝,AI獲得勝利只是“時(shí)間問(wèn)題”。里德?tīng)栄a(bǔ)充說(shuō),他不認(rèn)為這些比賽表明《星際爭(zhēng)霸2》已經(jīng)被AI徹底掌控。他表示:“在上一場(chǎng)直播比賽中,限制AlphaStar的某些能力確實(shí)消除了它的許多人為優(yōu)勢(shì)。但我們看到的更大的問(wèn)題是,當(dāng)人們可以把AI推出舒適區(qū)時(shí),它就會(huì)崩潰?!?/p>

丹麥哥本哈根信息技術(shù)大學(xué)的塞巴斯蒂安·里斯(Sebastian Risi)表示:“這看起來(lái)是向前邁出的一大步。我們不知道這其間有多少創(chuàng)新,但培訓(xùn)AI的方式似乎是關(guān)鍵。”里斯的同事尼爾斯·賈斯特森(Niels Justesen)說(shuō):“我沒(méi)想到會(huì)發(fā)生這樣的事情,尤其是因?yàn)橹暗亩说蕉藢W(xué)習(xí)《星際爭(zhēng)霸》的嘗試遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到人類(lèi)的水平?!?/p>

殘酷的強(qiáng)化學(xué)習(xí)AI競(jìng)技場(chǎng)

最終,這類(lèi)工作的最終目標(biāo)不是利用AI在視頻游戲中擊敗人類(lèi),而是改進(jìn)AI的訓(xùn)練方法,尤其是為了創(chuàng)建能夠在《星際爭(zhēng)霸》等復(fù)雜虛擬環(huán)境中運(yùn)行的系統(tǒng)。

為了訓(xùn)練AlphaStar,DeepMind的研究人員使用了被稱(chēng)為強(qiáng)化學(xué)習(xí)的方法。AI智能體基本上是通過(guò)反復(fù)嘗試才能達(dá)到某些目標(biāo),比如贏球或者僅僅是生存下去。它們首先通過(guò)模仿人類(lèi)玩家來(lái)學(xué)習(xí),然后在類(lèi)似競(jìng)技比賽中相互對(duì)決。最強(qiáng)的AI會(huì)存活下來(lái),最弱的則被淘汰。DeepMind估計(jì),其每個(gè)AlphaStar智能體都以這種方式積累了大約200年的游戲時(shí)間,游戲速度也在加快。

DeepMind很清楚自己開(kāi)展這項(xiàng)工作的目標(biāo)。AlphaStar項(xiàng)目聯(lián)合負(fù)責(zé)人奧里爾·維尼亞斯(Oriol Vinyals)說(shuō):“首先,也是最重要的,DeepMind的任務(wù)是建立通用AI,它可以執(zhí)行人類(lèi)所能完成的任何心理任務(wù)。要實(shí)現(xiàn)這個(gè)目標(biāo),最重要的就是對(duì)我們的AI智能體在各種任務(wù)中的表現(xiàn)進(jìn)行基準(zhǔn)測(cè)試。”

科技媒體Engadget評(píng)論道,谷歌旗下的AI子公司DeepMind已經(jīng)轉(zhuǎn)向電腦游戲,其AI系統(tǒng)始終在進(jìn)行微調(diào),以適應(yīng)《星際爭(zhēng)霸2》。今天的《星際爭(zhēng)霸2》比賽,是AlphaStar與職業(yè)玩家的第一次正面交鋒。在兩場(chǎng)五局的系列比賽中,AlphaStar戰(zhàn)勝了職業(yè)選手TLO和MaNa,贏得了10場(chǎng)勝利。而在連續(xù)十次失利后,人類(lèi)玩家終于贏得了最后一場(chǎng)比賽。

DeepMind的野心

雖然游戲并不能很好地展示這項(xiàng)技術(shù),但它確實(shí)描繪了DeepMind在理解人類(lèi)行為方面取得的長(zhǎng)足進(jìn)步。最終,這項(xiàng)技術(shù)可以被用于許多其他領(lǐng)域,如理論物理學(xué),甚至醫(yī)學(xué)。紐約大學(xué)的朱利安·加里烏斯(Julian lius)表示:“我認(rèn)為《星際爭(zhēng)霸》就像是在經(jīng)營(yíng)一家公司,尤其是后勤部門(mén)。關(guān)鍵是要規(guī)劃研發(fā),在正確的時(shí)間把產(chǎn)品送到正確的地方,避免瓶頸?!?/p>

AlphaStar也可以幫助專(zhuān)業(yè)人士改善他們的策略。馬耳他大學(xué)的Georgios Yannakakis稱(chēng):“如果AI能夠找到最優(yōu)的游戲方式,那將是非常令人興奮的。這畢竟是人們構(gòu)建AI的原因之一。目前來(lái)說(shuō),很多人都不想在任何游戲中遇到DeepMind的AI對(duì)手,更不用說(shuō)像《星際爭(zhēng)霸2》中與其進(jìn)行激烈對(duì)決了。(選自:The Verge編譯:網(wǎng)易智能 參與:小?。?/p>

延伸閱讀

人工智能是否威脅人類(lèi)?有人預(yù)測(cè):每天在研究你,幫你做婚姻選擇

2018年12月第一期《科學(xué)》雜志封面,向人們介紹了一位“數(shù)字神童”——史上最強(qiáng)棋圣“阿爾法零”。作為兩年前驚艷亮相的人工智能“阿爾法圍棋”進(jìn)化版,“阿爾法零”不但征服了圍棋,而且僅分別“自學(xué)”2小時(shí)和4小時(shí)后,就擊敗最強(qiáng)的日本將棋和國(guó)際象棋人工智能程序。

AI碾壓星際爭(zhēng)霸2:AI玩家在連續(xù)10局中反復(fù)擊敗人類(lèi)

“阿爾法零”的飛速成長(zhǎng),代表了2018年人工智能的進(jìn)步。在移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、超級(jí)計(jì)算和腦科學(xué)等新理論新技術(shù)的驅(qū)動(dòng)下,問(wèn)世60余年、遭遇多次質(zhì)疑的人工智能迎來(lái)新一輪發(fā)展熱潮,真正進(jìn)入了落地實(shí)踐階段:各國(guó)新政密集出臺(tái)、科技巨頭紛紛布局、最新進(jìn)展日新月異……一個(gè)“新智能時(shí)代”正在到來(lái)。

無(wú)所不在

“阿爾法”系列人工智能不僅在棋牌領(lǐng)域打遍人類(lèi)無(wú)敵手,最新的“阿爾法折疊”還能有效預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),并在12月初的一個(gè)國(guó)際競(jìng)賽中擊敗眾多對(duì)手奪冠。研制“阿爾法”系列程序的英國(guó)“深層思維”公司發(fā)表聲明說(shuō),這“證明人工智能可驅(qū)動(dòng)和加速科學(xué)新發(fā)現(xiàn)”。

從科研成果看,人工智能正在眾多領(lǐng)域“開(kāi)疆辟土”,醫(yī)療健康領(lǐng)域首當(dāng)其沖。過(guò)去一年,從確定藥物分子結(jié)構(gòu)到提高藥物開(kāi)發(fā)效率,從早期癌癥診斷到預(yù)測(cè)腫瘤發(fā)展,都可以看到人工智能在發(fā)揮作用。比如,美國(guó)加州大學(xué)洛杉磯分校的一項(xiàng)人工智能成果,能比醫(yī)生診斷提早6年預(yù)測(cè)出阿爾茨海默病;美國(guó)斯坦福大學(xué)的物理學(xué)家開(kāi)發(fā)出一種人工智能程序,只用幾個(gè)小時(shí)就“重新發(fā)現(xiàn)”了元素周期表;科學(xué)家已經(jīng)開(kāi)始利用人工智能研究地震、海嘯的預(yù)防。

在應(yīng)用上,美國(guó)醫(yī)療管理機(jī)構(gòu)已批準(zhǔn)了首個(gè)人工智能醫(yī)療器械,用于篩查糖尿病性視網(wǎng)膜病變;阿里云正利用人工智能幫助馬來(lái)西亞首都吉隆坡“治堵”;日本警方將對(duì)預(yù)防犯罪的人工智能系統(tǒng)進(jìn)行測(cè)試;人工智能還成為體育界智囊,幫助運(yùn)動(dòng)員磨煉技能,提高比賽成績(jī)……

總體看,超強(qiáng)的計(jì)算能力、與日俱增的海量數(shù)據(jù)以及不斷涌現(xiàn)的優(yōu)秀算法三者結(jié)合,驅(qū)動(dòng)人工智能加速發(fā)展,逐漸“脫虛向?qū)崱薄V稍?xún)公司普華永道發(fā)布的報(bào)告顯示,到2030年,人工智能將給全球國(guó)內(nèi)生產(chǎn)總值帶來(lái)14%的增長(zhǎng),相當(dāng)于15.7萬(wàn)億美元。

專(zhuān)家們相信,未來(lái)人工智能將會(huì)像水、電一樣無(wú)所不在,顛覆和變革醫(yī)療、金融、運(yùn)輸、制造、服務(wù)、體育和軍事等各個(gè)行業(yè)。

目前,從美國(guó)的GAFA(谷歌、蘋(píng)果、臉書(shū)、亞馬遜)到中國(guó)的BAT(百度、阿里巴巴、騰訊),都在人工智能上押下重注。百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏說(shuō):“未來(lái)沒(méi)有任何一家企業(yè)可以宣稱(chēng)跟人工智能沒(méi)有關(guān)系?!?/p>

大國(guó)爭(zhēng)先

“人工智能不僅是俄羅斯的未來(lái),也是全人類(lèi)的未來(lái)……誰(shuí)成為這一領(lǐng)域的領(lǐng)導(dǎo)者,誰(shuí)就將是世界的主宰者?!倍砹_斯總統(tǒng)普京曾這樣說(shuō)。

不僅普京,德國(guó)總理默克爾、法國(guó)總統(tǒng)馬克龍和英國(guó)首相特雷莎·梅等多個(gè)大國(guó)的領(lǐng)導(dǎo)人都曾表達(dá)對(duì)人工智能的重視。2018年,各個(gè)大國(guó)均把加快發(fā)展人工智能上升至國(guó)家戰(zhàn)略高度布局深耕,以搶占新一輪科技革命和產(chǎn)業(yè)變革的制高點(diǎn)。

——3月,馬克龍公布法國(guó)人工智能發(fā)展戰(zhàn)略,計(jì)劃在2022年他的首任總統(tǒng)任期結(jié)束前投入15億歐元,將法國(guó)打造成人工智能研發(fā)世界一流強(qiáng)國(guó)。

——5月,美國(guó)白宮召開(kāi)“美國(guó)產(chǎn)業(yè)人工智能峰會(huì)”,希望確保美國(guó)的“全球技術(shù)絕對(duì)優(yōu)勢(shì)”。白宮還在2019財(cái)年預(yù)算申請(qǐng)中首次將人工智能列為政府研發(fā)重點(diǎn)。

——英國(guó)首相梅今年多次發(fā)表講話(huà),宣布英國(guó)將在人工智能方面投入約10億英鎊,爭(zhēng)當(dāng)這一領(lǐng)域的世界領(lǐng)頭羊,其中一個(gè)重要目標(biāo)是利用人工智能技術(shù),到2033年減少2萬(wàn)名癌癥患者。

——11月,德國(guó)政府出臺(tái)《人工智能戰(zhàn)略》,計(jì)劃在2025年前投資30億歐元推動(dòng)德國(guó)人工智能發(fā)展。默克爾說(shuō),德國(guó)的目標(biāo)是讓“‘德國(guó)制造’也成為人工智能領(lǐng)域的一個(gè)品牌”。

——中國(guó)也把新一代人工智能視為一個(gè)重要前沿,并提出到2030年人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。

業(yè)界普遍認(rèn)為,整體來(lái)看,中美已成為全球人工智能發(fā)展的兩強(qiáng)。美國(guó)在人工智能研究方面占據(jù)領(lǐng)先位置,而中國(guó)在人工智能應(yīng)用方面的成就有目共睹。業(yè)內(nèi)專(zhuān)家認(rèn)為,未來(lái)很長(zhǎng)一段時(shí)間內(nèi)兩國(guó)在這一領(lǐng)域可以?xún)?yōu)勢(shì)互補(bǔ)。

人機(jī)協(xié)作

隨著“新智能時(shí)代”的到來(lái),許多人問(wèn),人工智能將來(lái)到底會(huì)有多“智能”?也有人擔(dān)心,人工智能未來(lái)會(huì)不會(huì)威脅到人類(lèi)?

其實(shí),人工智能有強(qiáng)弱之分,當(dāng)前乃至未來(lái)很長(zhǎng)一段時(shí)間,人工智能都將處于“弱智能”階段,還只能局限在特定的封閉領(lǐng)域,就好像“阿爾法圍棋”和“阿爾法零”只能下棋,干不了其他工作。

業(yè)界一致看法是,人工智能會(huì)延展人類(lèi)的能力,放大并提升人類(lèi)智能,但并非取代人類(lèi)。人機(jī)協(xié)作,大幅提高工作效率,才是人工智能應(yīng)有的未來(lái)。

至于未來(lái)人工智能是否會(huì)達(dá)到所謂技術(shù)“奇點(diǎn)”形成獨(dú)立人格,專(zhuān)家們認(rèn)為,按照現(xiàn)有技術(shù)模式,這種可能性為零,機(jī)器人革命甚至毀滅人類(lèi)完全屬于好萊塢式的杞人憂(yōu)天。

人工智能局限性的一個(gè)原因在于,今天的機(jī)器尚不具備情景推理能力,必須訓(xùn)練它們涵蓋所有可能發(fā)生的情況,這不僅代價(jià)高昂,而且難以實(shí)現(xiàn)。也正因此,2011年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、美國(guó)經(jīng)濟(jì)學(xué)家托馬斯·薩金特才表示,人工智能不過(guò)是統(tǒng)計(jì)學(xué)。

雖無(wú)遠(yuǎn)慮,但對(duì)人工智能的一個(gè)現(xiàn)實(shí)“近憂(yōu)”是,它已經(jīng)在和人類(lèi)搶工作。但最新的系列研究認(rèn)為,人工智能對(duì)未來(lái)就業(yè)的影響并非如想象的那樣悲觀。根據(jù)世界經(jīng)濟(jì)論壇發(fā)布的《2018未來(lái)就業(yè)》報(bào)告,未來(lái)5年,盡管7500萬(wàn)份工作將被機(jī)器取代,但1.33億份新工作將同步產(chǎn)生,這意味著凈增的新工作崗位多達(dá)5800萬(wàn)。

暢銷(xiāo)書(shū)《人類(lèi)簡(jiǎn)史》作者尤瓦爾·赫拉利預(yù)測(cè),隨著人工智能和生物技術(shù)的飛速發(fā)展,人機(jī)融合將在本世紀(jì)完全實(shí)現(xiàn),人類(lèi)未來(lái)生活將發(fā)生難以想象地巨變。

“未來(lái),機(jī)器將比你更了解你自己,”赫拉利說(shuō),“人工智能程序在你出生后的每一天都在研究你,從每一封郵件到每一秒心跳,最終它完全可以在任何事情上幫你作出更有利的選擇,包括婚姻這種‘終身大事’?!?br/>

(責(zé)任編輯:崔鳳璇 CN072)
關(guān)鍵詞:

相關(guān)報(bào)道:

    關(guān)閉
     

    相關(guān)新聞