日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁(yè) >要聞 > 2020-12-12 08:36:01 來(lái)源:

        特工在捉迷藏游戲中表現(xiàn)出令人驚訝的行為

        導(dǎo)讀 研究人員在讓他們的AI野心發(fā)揮出巨大的捉迷藏游戲中取得了令人震驚的結(jié)果。特工的環(huán)境有墻和可移動(dòng)的盒子,用于挑戰(zhàn),其中一些是藏身者,而

        研究人員在讓他們的AI野心發(fā)揮出巨大的捉迷藏游戲中取得了令人震驚的結(jié)果。特工的環(huán)境有墻和可移動(dòng)的盒子,用于挑戰(zhàn),其中一些是藏身者,而另一些則是尋找者。一路上發(fā)生了很多事,令人驚訝。

        作者說(shuō)到學(xué)到的東西后寫(xiě)道:“我們觀察到代理商在玩簡(jiǎn)單的捉迷藏游戲時(shí)發(fā)現(xiàn)了越來(lái)越復(fù)雜的工具使用,”代理商建立了“一系列六種不同的策略和對(duì)策,其中一些我們不知道我們的環(huán)境支持什么。”

        在本周早些時(shí)候發(fā)布的新論文中,該團(tuán)隊(duì)透露了結(jié)果。他們的論文“來(lái)自Multi-Agent Autocurricula的緊急工具使用”有7位作者,其中6位列出了OpenAI代表,一位是Google Brain。

        作者評(píng)論了他們所面臨的挑戰(zhàn)。“創(chuàng)建可以解決各種各樣與人類有關(guān)的復(fù)雜任務(wù)的智能人工代理,一直是人工智能界的長(zhǎng)期挑戰(zhàn)。”

        該團(tuán)隊(duì)說(shuō):“我們發(fā)現(xiàn)代理創(chuàng)建了一個(gè)自我監(jiān)督的自動(dòng)課程,引發(fā)了多個(gè)不同的緊急策略回合,其中許多回合需要復(fù)雜的工具使用和協(xié)調(diào)。”

        通過(guò)捉迷藏,(1)追求者學(xué)會(huì)了追逐獸人,而逃逸者也得以逃脫(2)食者們學(xué)會(huì)了基本的工具使用方法-用箱子和墻壁建造堡壘。(3)搜尋者學(xué)會(huì)了使用坡道跳入藏身者的庇護(hù)所(4)藏身者學(xué)會(huì)了將坡道移到要建造堡壘的遠(yuǎn)處并將其鎖定到位(5)尋找者學(xué)會(huì)了可以從鎖定的坡道跳至箱子(6)藏匿者學(xué)會(huì)了在建造堡壘之前將未使用的盒子鎖上。

        這六種策略是隨著代理人在捉迷藏中相互訓(xùn)練而出現(xiàn)的,每種新策略都為代理人進(jìn)入下一階段創(chuàng)造了以前不存在的壓力,而沒(méi)有任何直接誘因促使代理人與對(duì)象互動(dòng)或探索。這些策略是多代理競(jìng)爭(zhēng)和“捉迷藏”動(dòng)力學(xué)引起的“自動(dòng)課程”的結(jié)果。

        該博客的作者說(shuō),他們了解到“代理商通常會(huì)以一種意想不到的方式找到利用您構(gòu)建的環(huán)境或物理引擎的方法。”

        最新文章