您現(xiàn)在的位置是:首頁(yè) >要聞 > 2020-12-07 16:49:43 來(lái)源:
研究人員使用機(jī)器學(xué)習(xí)來(lái)教機(jī)器人如何穿越未知的地形
由澳大利亞研究人員組成的團(tuán)隊(duì)設(shè)計(jì)了一種可靠的策略,用于測(cè)試類人機(jī)器人的物理能力,這些機(jī)器人在構(gòu)建和設(shè)計(jì)中都類似于人體形狀。通過(guò)混合使用機(jī)器學(xué)習(xí)方法和算法,研究團(tuán)隊(duì)成功地使測(cè)試機(jī)器人能夠?qū)δM環(huán)境中的未知變化做出有效反應(yīng),從而提高了它們?cè)诂F(xiàn)實(shí)世界中發(fā)揮作用的幾率。
這些發(fā)現(xiàn)發(fā)表在7月的IEEE和中國(guó)自動(dòng)化學(xué)會(huì)自動(dòng)化學(xué)報(bào)的聯(lián)合出版物中,對(duì)于在醫(yī)療保健,教育,災(zāi)難響應(yīng)和娛樂(lè)等領(lǐng)域中廣泛使用類人機(jī)器人具有潛在的啟示。
通訊作者大陶濤說(shuō):“類人機(jī)器人能夠以多種方式移動(dòng),從而模仿人類的運(yùn)動(dòng)來(lái)完成復(fù)雜的任務(wù)。為此,它們的穩(wěn)定性至關(guān)重要,特別是在動(dòng)態(tài)和不可預(yù)測(cè)的條件下,”悉尼大學(xué)計(jì)算機(jī)科學(xué)學(xué)院和工程學(xué)院教授兼ARC獲獎(jiǎng)研究員。
“我們已經(jīng)設(shè)計(jì)出一種方法,可以可靠地教導(dǎo)類人機(jī)器人執(zhí)行這些任務(wù),”陶先生補(bǔ)充說(shuō),他也是UBTECH悉尼人工智能中心的就職總監(jiān)。
類人機(jī)器人是類似于人的身體屬性(頭部,軀干和兩個(gè)手臂和腳)的機(jī)器人,并且具有與人和其他機(jī)器人進(jìn)行通信的能力。配備了傳感器和其他輸入設(shè)備的這些機(jī)器人還根據(jù)外部輸入執(zhí)行有限的活動(dòng)。
它們通常針對(duì)特定活動(dòng)進(jìn)行了預(yù)先編程,并且依賴兩種學(xué)習(xí)方法:基于模型的學(xué)習(xí)和基于模型的學(xué)習(xí)。前者教給機(jī)器人一套可以在場(chǎng)景中表現(xiàn)的模型,而后者則沒(méi)有。盡管這兩種學(xué)習(xí)方法都在一定程度上取得了成功,但僅靠每個(gè)范式還不足以使類人機(jī)器人在環(huán)境不斷變化且經(jīng)常無(wú)法預(yù)測(cè)的現(xiàn)實(shí)世界中發(fā)揮作用。
為了克服這個(gè)問(wèn)題,Tao和他的團(tuán)隊(duì)引入了一種新的學(xué)習(xí)結(jié)構(gòu),該結(jié)構(gòu)結(jié)合了基于模型的學(xué)習(xí)和無(wú)模型的學(xué)習(xí),以平衡兩足動(dòng)物或兩腿機(jī)器人。所提出的控制方法彌合了兩種學(xué)習(xí)范式之間的差距,從學(xué)習(xí)模型到學(xué)習(xí)實(shí)際過(guò)程的過(guò)渡已經(jīng)順利完成。仿真結(jié)果表明,該算法能夠在未知旋轉(zhuǎn)下將機(jī)器人穩(wěn)定在運(yùn)動(dòng)平臺(tái)上。這樣,這些方法證明了機(jī)器人能夠相應(yīng)地適應(yīng)不同的不可預(yù)測(cè)的情況,因此可以應(yīng)用于實(shí)驗(yàn)室環(huán)境之外的機(jī)器人。
將來(lái),研究人員希望在更復(fù)雜的環(huán)境中驗(yàn)證其方法的有效性,這些環(huán)境將具有更多不可預(yù)測(cè)和變化的變量,并且隨著測(cè)試機(jī)器人執(zhí)行全身控制的能力而具有不同的尺寸。
“我們的最終目標(biāo)是了解我們的方法如何使機(jī)器人能夠控制整個(gè)身體,因?yàn)樗艿讲豢晒懒康囊馔飧蓴_(例如變化的地形)。我們還希望了解機(jī)器人的學(xué)習(xí)能力。在沒(méi)有事先信息的情況下模仿人類運(yùn)動(dòng),例如踝關(guān)節(jié)運(yùn)動(dòng)。”