日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁(yè) >財(cái)經(jīng) > 2021-04-25 09:39:18 來(lái)源:

        OpenAI啟動(dòng)強(qiáng)化學(xué)習(xí)培訓(xùn)為人工一般智能做準(zhǔn)備

        導(dǎo)讀 OpenAI今天宣布推出Spinning Up,這是一個(gè)旨在教授任何深度強(qiáng)化學(xué)習(xí)的計(jì)劃。 OpenAI以在虛擬環(huán)境中制作看似時(shí)髦的代理而聞名,這些代理學(xué)

        OpenAI今天宣布推出Spinning Up,這是一個(gè)旨在教授任何深度強(qiáng)化學(xué)習(xí)的計(jì)劃。

        OpenAI以在虛擬環(huán)境中制作看似時(shí)髦的代理而聞名,這些代理學(xué)習(xí)如何自行走,例如與華盛頓大學(xué)合作的Humanoid v2或POLO。

        OpenAI啟動(dòng)強(qiáng)化學(xué)習(xí)培訓(xùn)為人工一般智能做準(zhǔn)備

        強(qiáng)化學(xué)習(xí)包括在激勵(lì)的環(huán)境中向代理提供獎(jiǎng)勵(lì)信號(hào),以最大化其獎(jiǎng)勵(lì)以實(shí)現(xiàn)目標(biāo)。

        RL在主要的AI突破中發(fā)揮了作用,例如Google DeepMind的AlphaGo以及在Dota 2等環(huán)境中受過(guò)培訓(xùn)的代理商。

        Spinning Up包括一系列重要的強(qiáng)化學(xué)習(xí)研究論文,理解RL所必需的術(shù)語(yǔ)表,以及一系列運(yùn)行練習(xí)的算法。

        該計(jì)劃的目的不僅是幫助人們了解強(qiáng)化學(xué)習(xí)是如何運(yùn)作的,而且是為了通過(guò)讓更多來(lái)自計(jì)算機(jī)科學(xué)領(lǐng)域的人參與安全地創(chuàng)建人工智能(AGI)來(lái)實(shí)現(xiàn)OpenAI的總體目標(biāo)。

        “解決人工智能安全問(wèn)題需要具備廣泛專業(yè)知識(shí)和觀點(diǎn)的人才,許多相關(guān)專業(yè)與工程或計(jì)算機(jī)科學(xué)毫無(wú)關(guān)聯(lián)。盡管如此,所涉及的每個(gè)人都需要充分了解技術(shù)以做出明智的決策,以及需要的幾個(gè)Spinning Up地址,“根據(jù)Spinning Up文檔文本。

        通過(guò)與OpenAI學(xué)者和研究員合作獲得Spinning Up,他們對(duì)AI有著好奇的興趣,但在該領(lǐng)域缺乏經(jīng)驗(yàn)。

        除了在安全部署AGI的目標(biāo)方面取得進(jìn)展之外,該計(jì)劃的創(chuàng)建是因?yàn)槟壳皼](méi)有單一的教科書(shū)可以提供實(shí)施強(qiáng)化學(xué)習(xí)所需的知識(shí); 目前的知識(shí)被鎖定在一系列不同的講座和有影響力的研究論文中。

        “所以我們這里的套餐旨在成為那些深受RL激動(dòng)的人們的缺失中間步驟,并希望學(xué)習(xí)如何使用它或做出貢獻(xiàn),但是沒(méi)有明確的學(xué)習(xí)內(nèi)容或如何將算法轉(zhuǎn)化為代碼。我們?cè)噲D使這個(gè)作為一個(gè)有用的啟動(dòng)點(diǎn),“ 項(xiàng)目頁(yè)面讀取。

        Spinning Up計(jì)劃是OpenAI打算提供的更多教育服務(wù)的一部分。Spinning Up研討會(huì)將于2019年2月舉行,另一個(gè)研討會(huì)將與 加州大學(xué)伯克利分校的人類兼容AI(CHAI)中心共同舉辦。