您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-17 08:43:12 來源:
RoboTurk機器人模仿學(xué)習(xí)的眾包平臺
模仿學(xué)習(xí)是機器學(xué)習(xí)的一個分支,可以訓(xùn)練機器模仿人類的行為,同時完成特定的任務(wù)。這些技術(shù)解決了強化學(xué)習(xí)的一些缺點,例如探索和獎勵規(guī)范,在機器人技術(shù)領(lǐng)域顯示出巨大的希望。
盡管取得了令人鼓舞的結(jié)果,但由于難以使用現(xiàn)有方法收集大量任務(wù)演示,因此模仿學(xué)習(xí)研究迄今僅限于中等規(guī)模的數(shù)據(jù)集。為了解決這些局限性,由斯坦福大學(xué)的Silvio Savarese博士和Lii-Fei Li博士督導(dǎo)的一組研究人員開發(fā)了RoboTurk,RoboTurk是一個眾包平臺,可使用廣泛使用的智能手機設(shè)備進行基于6自由度軌跡的高質(zhì)量遠程操作。
進行這項研究的研究人員之一阿杰·曼德卡爾(Ajay Mandlekar)告訴TechXplore:“我們想為機器人技術(shù)創(chuàng)建像ImageNet這樣的東西。” “我們認為數(shù)據(jù)是機器人學(xué)習(xí)領(lǐng)域的關(guān)鍵限制。盡管有很多方法可以從數(shù)據(jù)中學(xué)習(xí),例如數(shù)據(jù)驅(qū)動的控制和強化學(xué)習(xí),但大多數(shù)方法都是收集自己的數(shù)據(jù)。因此,數(shù)據(jù)通常是低質(zhì)量的,例如導(dǎo)致機器人隨機移動手臂。這種探索可能既困難又不安全,但我們相信人類可以提供幫助。”
ImageNet是由李博士創(chuàng)建的著名圖像數(shù)據(jù)庫,通常用于計算機視覺和對象識別研究。由斯坦福視覺與學(xué)習(xí)實驗室開發(fā)的眾包平臺旨在用作機器人技術(shù)和模仿學(xué)習(xí)研究的類似資源。
“與ImageNet不同,這樣的數(shù)據(jù)收集系統(tǒng)必須是動態(tài)的,允許我們重復(fù)地,經(jīng)常地按需收集數(shù)據(jù),甚至可以使用協(xié)作學(xué)習(xí)來收集數(shù)據(jù),”也參與了Roboturk開發(fā)的朱克(Yuke Zhu)告訴TechXplore。“這是因為收集的數(shù)據(jù)取決于機器人在環(huán)境中采取的動作類型。”
研究人員的最終目標是對機器人進行高級操作技能的培訓(xùn),使他們能夠在工業(yè)環(huán)境中完成包裝或組裝等任務(wù)。他們發(fā)現(xiàn),盡管模仿學(xué)習(xí)在這種情況下顯示出巨大的潛力,但由于難以收集大量任務(wù)演示,現(xiàn)有的數(shù)據(jù)集非常有限。