日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁(yè) >互聯(lián)網(wǎng) > 2020-10-20 11:35:22 來源:

        OpenAI使用新的模擬技術(shù)來教機(jī)器人如何解決魔方

        導(dǎo)讀 自動(dòng)化Rubik的多維數(shù)據(jù)集求解器在機(jī)器人競(jìng)賽中非常常見,因此吉尼斯世界紀(jì)錄為此專門設(shè)置了一個(gè)類別。但是OpenAI Inc 在該領(lǐng)域的新進(jìn)入?yún)s

        自動(dòng)化Rubik的多維數(shù)據(jù)集求解器在機(jī)器人競(jìng)賽中非常常見,因此吉尼斯世界紀(jì)錄為此專門設(shè)置了一個(gè)類別。但是OpenAI Inc.在該領(lǐng)域的新進(jìn)入?yún)s引人注目。

        今天,人工智能研究實(shí)驗(yàn)室推出了一只機(jī)器人手(如圖所示),弄清楚了如何在沒有人工指導(dǎo)的情況下解開魔方的瓷磚。它使用OpenAI開發(fā)的突破性培訓(xùn)技術(shù)來實(shí)現(xiàn)這一目標(biāo),該技術(shù)可以幫助自己構(gòu)建新一代更靈活,更適應(yīng)性強(qiáng)的自主機(jī)器。

        如今,大多數(shù)現(xiàn)存的機(jī)器人僅限于執(zhí)行極其狹窄的任務(wù)。這不僅是硬件限制的結(jié)果,而且在某些情況下甚至不是主要的原因。相反,它與以下事實(shí)有關(guān):訓(xùn)練AI在現(xiàn)實(shí)世界中移動(dòng)和操作充滿了障礙。

        工程師大多依靠仿真為其機(jī)器人構(gòu)建機(jī)器學(xué)習(xí)模型。基本思想是創(chuàng)建一個(gè)虛擬設(shè)置,該虛擬設(shè)置模仿系統(tǒng)將在其中運(yùn)行的環(huán)境,將AI設(shè)置在內(nèi)部松散并使其通過反復(fù)試驗(yàn)來學(xué)習(xí)。經(jīng)過數(shù)百萬(wàn)次嘗試,神經(jīng)網(wǎng)絡(luò)甚至可以掌握復(fù)雜的任務(wù),例如 兩條腿走路。

        問題是在需要將AI安裝在主機(jī)機(jī)器人上時(shí)開始的。模擬無法完全解決現(xiàn)實(shí)世界中存在的無數(shù)變量,這意味著機(jī)器學(xué)習(xí)模型通常最終會(huì)面臨無法教給他們的意外挑戰(zhàn)。

        輸入OpenAI的新培訓(xùn)方法。通過為訓(xùn)練仿真注入不確定性,實(shí)驗(yàn)室為AI配備了驅(qū)動(dòng)其機(jī)器人手的AI,以應(yīng)對(duì)意外情況。在一個(gè)學(xué)習(xí)環(huán)節(jié)中,虛擬房間的重力可能類似于地球表面上的重力,而在下一課程中,虛擬房間的重力可能更強(qiáng),甚至來自不同的角度。

        “我們隨機(jī)化的參數(shù)之一是魔方的大小,” OpenAI的研究人員在博客文章中詳細(xì)闡述。“ ADR從固定大小的魔方開始,然后隨著訓(xùn)練的進(jìn)行逐漸增加隨機(jī)范圍。我們將相同的技術(shù)應(yīng)用于所有其他參數(shù),例如立方體的質(zhì)量,機(jī)器人手指的摩擦力和手的視覺表面材料。”

        該過程由第二個(gè)機(jī)器學(xué)習(xí)模型執(zhí)行,隨著機(jī)器人手的AI的提高,仿真變得越來越困難。研究人員解釋說:“隨著神經(jīng)網(wǎng)絡(luò)在任務(wù)中變得更好并達(dá)到性能閾值,域隨機(jī)化的數(shù)量會(huì)自動(dòng)增加。”

        該項(xiàng)目取得了一些令人鼓舞的初步結(jié)果。當(dāng)模型在現(xiàn)實(shí)環(huán)境中釋放時(shí),它駕駛的機(jī)器人手戴著橡膠手套,用幾根手指綁在一起,設(shè)法解決了魔方,甚至當(dāng)研究人員試圖用各種物體將立方體撞到地面上時(shí)。

        OpenAI相信培訓(xùn)技術(shù)也可能會(huì)在更嚴(yán)重的項(xiàng)目中得到應(yīng)用。當(dāng)遇到不可預(yù)見的障礙或障礙時(shí),該方法可能使工業(yè)機(jī)器人,無人機(jī)和其他自主機(jī)器能夠動(dòng)態(tài)修改其行為。這種多功能性將是實(shí)現(xiàn)AI的圣杯的重要一步,這是自學(xué)人工智能的通用智能。

        自從7月份與微軟公司建立了10億美元的合作伙伴關(guān)系以來,Rubik的Cube求解器是OpenAI詳述的首批重大項(xiàng)目之一 。根據(jù)協(xié)議,微軟將為實(shí)驗(yàn)室提供資本和云基礎(chǔ)設(shè)施,以支持研究,以換取知識(shí)產(chǎn)權(quán)。