日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁(yè) >教育 > 2020-11-19 17:16:27 來(lái)源:

        DeepMind的AlphaZero為古老的棋藝注入了新的活力

        導(dǎo)讀 國(guó)際象棋大師威廉·納皮爾(William Napier)曾說(shuō):對(duì)于象棋來(lái)說(shuō),生命還不夠長(zhǎng),但這是生命的錯(cuò),而不是象棋。該游戲的棋本身已經(jīng)有一個(gè)光

        國(guó)際象棋大師威廉·納皮爾(William Napier)曾說(shuō):“對(duì)于象棋來(lái)說(shuō),生命還不夠長(zhǎng),但這是生命的錯(cuò),而不是象棋。”該游戲的棋本身已經(jīng)有一個(gè)光榮使用壽命長(zhǎng),具有最早在公元600年恢復(fù)古老的游戲約會(huì)的文物是古代波斯薩珊王朝。

        幾個(gè)世紀(jì)以來(lái),該游戲經(jīng)歷了數(shù)百次修改,調(diào)整和增強(qiáng)。在估計(jì)的2,000種游戲變體中,大多數(shù)只是在最近幾年才開發(fā)出來(lái)。一個(gè)單獨(dú)的版本本身稱為Chess960(由世界象棋冠軍Bobby Fischer創(chuàng)建),具有960種游戲變體,每個(gè)版本都重新排列了所有游戲棋子的標(biāo)準(zhǔn)位置。

        游戲的吸引力是普遍的。在過(guò)去的幾十年中,隨著計(jì)算機(jī)播放器的推出,引起了人們的興趣。計(jì)算機(jī)被證明是強(qiáng)大的,最終是無(wú)與倫比的敵人。1997年,IBM龐大的Deep Blue擊敗了衛(wèi)冕世界國(guó)際象棋冠軍Gary Kasparov,取得了空前的勝利。到2007年,一部手機(jī)已經(jīng)以9次勝利和1次平局征服了比賽挑戰(zhàn)者。

        但是近年來(lái),隨著玩家越來(lái)越依賴計(jì)算機(jī)象棋引擎進(jìn)行游戲的制定和策略,越來(lái)越多的游戲愛好者表示了驚ster 。決定性比賽的數(shù)量也明顯減少。

        正如國(guó)際象棋大師弗拉基米爾·克拉姆尼克(Vladimir Kramnik)最近對(duì)《連線》雜志說(shuō)的那樣:“對(duì)于很多最高級(jí)別的游戲來(lái)說(shuō),一半的游戲(有時(shí)是一整場(chǎng)游戲)的記憶力不足。您計(jì)算機(jī)的準(zhǔn)備工作。”

        谷歌的DeepMind AI項(xiàng)目的人們開始為此做點(diǎn)事情。他們邀請(qǐng)Kramnik與AI研究人員合作,因?yàn)樗麄儼l(fā)布了AlphaZero.AlphaZero在2017年自學(xué)成敗于象棋,圍棋和將棋等游戲的專家。他們的目標(biāo)是:“創(chuàng)造性地探索和設(shè)計(jì)新的國(guó)際象棋變體”,同時(shí)保留游戲的基本原理。

        給AlphaZero提供了九個(gè)參數(shù),這些參數(shù)可以改變游戲的主要?jiǎng)幼鳎缓螵?dú)自學(xué)習(xí)游戲并制定新的取勝策略。

        DeepMind在周三發(fā)布的博客中說(shuō):“通過(guò)不斷地從自身經(jīng)驗(yàn)中學(xué)習(xí),該系統(tǒng)可以從頭開始為任何規(guī)則集學(xué)習(xí)近乎最優(yōu)的策略,”

        除了這9個(gè)變量之外,AlphaZero還從頭開始學(xué)習(xí)國(guó)際象棋。例如,它不知道它可以捕獲對(duì)手的棋子。它基本上是在幾個(gè)小時(shí)內(nèi)學(xué)會(huì)了人類需要數(shù)年才能掌握的知識(shí)。

        引入的變量為游戲帶來(lái)了新的深度,其中包括禁止擲骰子(此舉可以保護(hù)國(guó)王的身后幾步之類的動(dòng)作)和自我俘獲的概念,在這種情況下,人們可以擊敗自己的民兵來(lái)實(shí)現(xiàn)戰(zhàn)略優(yōu)勢(shì)。 。魚雷的另一個(gè)新元素是魚雷,它允許棋子在整個(gè)游戲中一次移動(dòng)兩個(gè)空間。

        DeepMind博客指出:“通過(guò)使用AlphaZero為每種變體學(xué)習(xí)接近最佳的策略,我們確定了如果采用了這些變體,則在強(qiáng)大的人類玩家之間的游戲會(huì)是什么樣子。我們的發(fā)現(xiàn)證明了現(xiàn)代規(guī)則之外的豐富可能性棋。”

        隨著AlphaZero的發(fā)展,它從本質(zhì)上重建了游戲的歷史性戰(zhàn)略發(fā)展,但是卻在幾個(gè)小時(shí)而不是幾個(gè)世紀(jì)的時(shí)間內(nèi)進(jìn)行了重建。

        有人說(shuō),AlphaZero戰(zhàn)略比老式象棋引擎更自然地進(jìn)行。英國(guó)大師馬修·薩爾德(Matthew Salder)驚嘆于AlphaZero的娛樂(lè)性和對(duì)看似無(wú)限的國(guó)際象棋策略的探索。他說(shuō),這就像“發(fā)現(xiàn)過(guò)去某個(gè)偉大球員的秘密筆記本”。

        分析AlphaZero的策略,應(yīng)用變體,甚至重新設(shè)計(jì)棋盤(就像Fischer日益流行的Chess960所做的那樣),都在推動(dòng)人們將其視為對(duì)百年國(guó)際象棋藝術(shù)的重塑。