您現(xiàn)在的位置是:首頁 >要聞 > 2020-11-27 16:45:20 來源:
Google的機器人學會在現(xiàn)實世界中行走
導讀 機器人領(lǐng)域向前邁出了一步,緊隨其后的又是另一步。最近,一個名為Rainbow Dash的機器人自學了走路。這只四腳機器只需要幾個小時就可以學
機器人領(lǐng)域向前邁出了一步,緊隨其后的又是另一步。最近,一個名為Rainbow Dash的機器人自學了走路。這只四腳機器只需要幾個小時就可以學會向前和向后行走,并在此過程中左右旋轉(zhuǎn)。
谷歌,加州大學伯克利分校和佐治亞理工學院的研究人員在ArXiv預印本服務(wù)器上發(fā)表了一篇論文,描述了一種統(tǒng)計AI技術(shù),即深度強化學習,他們使用這種技術(shù)來獲得這一成就,這是很重要的,原因有很多。
大多數(shù)強化學習部署都在計算機模擬的環(huán)境中進行。但是,Rainbow Dash使用此技術(shù)來學習在實際物理環(huán)境中行走。
而且,它能夠在沒有專門的教學機制的情況下做到這一點,例如人工指導或帶有標簽的培訓數(shù)據(jù)。最終,Rainbow Dash成功地在多個表面上行走,包括柔軟的泡沫床墊和帶有明顯凹口的門墊。
機器人使用的深度強化學習技術(shù)包括一種機器學習,其中代理與環(huán)境交互以通過反復試驗來學習。大多數(shù)強化學習用例都涉及計算機游戲,其中數(shù)字特工學習如何玩贏。
這種形式的機器學習與傳統(tǒng)的有監(jiān)督或無監(jiān)督學習明顯不同,在傳統(tǒng)的有監(jiān)督或無監(jiān)督學習中,機器學習模型需要標記的訓練數(shù)據(jù)來學習。深度強化學習將強化學習方法與深度學習相結(jié)合,傳統(tǒng)的機器學習的規(guī)模隨著強大的計算能力而大大擴展。