您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-23 13:44:35 來源:
機(jī)器人現(xiàn)在可以在檢查后拾取任何物體
人類長期以來一直是靈巧的主人,這種技能在很大程度上歸功于我們眼中的幫助。與此同時(shí),機(jī)器人仍在迎頭趕上。
當(dāng)然有一些進(jìn)步:幾十年來,裝配線等受控環(huán)境中的機(jī)器人能夠一次又一次地拾取同一物體。最近,計(jì)算機(jī)視覺的突破使機(jī)器人能夠在物體之間進(jìn)行基本區(qū)分。盡管如此,系統(tǒng)并沒有真正理解物體的形狀,因此機(jī)器人在快速拾取后幾乎無法做到。
麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員在一篇新論文中表示,他們已經(jīng)在這個(gè)工作領(lǐng)域做了一個(gè)重要的發(fā)展:一個(gè)讓機(jī)器人能夠檢查隨機(jī)物體并在視覺上理解它們以完成具體工作的系統(tǒng)。沒有見過他們的任務(wù)。
該系統(tǒng)稱為Dense Object Nets(DON),它將對象視為點(diǎn)集合,用作視覺路線圖。這種方法可以讓機(jī)器人更好地理解和操縱物品,最重要的是,它們甚至可以讓他們甚至在類似的雜亂中拾取特定物品 - 這是亞馬遜和沃爾瑪?shù)裙驹谄鋫}庫中使用的各種機(jī)器的寶貴技能。
例如,有人可能會(huì)使用DON讓機(jī)器人抓住物體上的特定位置,比如鞋子的舌頭。從那以后,它可以看到它以前從未見過的鞋子,并成功抓住它的舌頭。
“許多操縱方法無法識(shí)別物體可能遇到的多個(gè)方向的物體的特定部分,”博士生Lucas Manuelli說道,他與主要作者和博士生Pete Florence一起撰寫了一篇關(guān)于該系統(tǒng)的新論文,與麻省理工學(xué)院一起Russ Tedrake教授。“例如,現(xiàn)有的算法無法通過手柄抓住馬克杯,特別是如果馬克杯可能處于多個(gè)方向,如直立或側(cè)面。”
該團(tuán)隊(duì)不僅在制造環(huán)境中,而且在家庭中都看到了潛在的應(yīng)用。想象一下,給系統(tǒng)一個(gè)整潔的房子的圖像,讓你在工作時(shí)清潔,或使用菜肴的圖像,以便系統(tǒng)在你度假時(shí)把你的盤子放好。
還值得注意的是,沒有一個(gè)數(shù)據(jù)實(shí)際上被人類標(biāo)記過。相反,該系統(tǒng)是團(tuán)隊(duì)所謂的“自我監(jiān)督”,不需要任何人類注釋。
機(jī)器人抓取的兩種常見方法涉及任務(wù)特定學(xué)習(xí)或創(chuàng)建一般抓取算法。這些技術(shù)都有障礙:特定于任務(wù)的方法難以推廣到其他任務(wù),并且一般的掌握不足以處理特定任務(wù)的細(xì)微差別,例如將對象放在特定位置。
然而,DON系統(tǒng)基本上在給定物體上創(chuàng)建一系列坐標(biāo),作為一種視覺路線圖,使機(jī)器人更好地理解它需要掌握的內(nèi)容,以及在哪里。
該團(tuán)隊(duì)訓(xùn)練系統(tǒng)將對象視為構(gòu)成較大坐標(biāo)系的一系列點(diǎn)。然后,它可以將不同的點(diǎn)映射到一起,以顯示對象的3-D形狀,類似于從多張照片拼接全景照片的方式。在訓(xùn)練之后,如果一個(gè)人指定一個(gè)物體上的一個(gè)點(diǎn),機(jī)器人可以拍攝該物體的照片,并識(shí)別和匹配點(diǎn),然后能夠在該指定點(diǎn)拾取物體。
這與UC-Berkeley的DexNet系統(tǒng)不同,后者可以掌握許多不同的項(xiàng)目,但不能滿足特定的要求。想象一個(gè)18個(gè)月大的孩子,他不明白你想要它玩哪個(gè)玩具但仍然可以抓住很多物品,而一個(gè)四歲的孩子可以回應(yīng)“在紅色的末端抓住你的卡車” “。
在軟毛蟲玩具上進(jìn)行的一組測試中,由DON驅(qū)動(dòng)的Kuka機(jī)器人手臂可以從一系列不同的配置中抓住玩具的右耳。這表明,除其他外,系統(tǒng)具有在對稱物體上區(qū)分左右的能力。
當(dāng)在不同棒球帽的箱子上進(jìn)行測試時(shí),DON可以選擇特定的目標(biāo)帽子,盡管所有的帽子都具有非常相似的設(shè)計(jì) - 并且之前從未在訓(xùn)練數(shù)據(jù)中看過帽子的照片。
“在工廠中,機(jī)器人通常需要復(fù)雜的零件供料器才能可靠地工作,”佛羅倫薩說。“但是像這樣能夠理解物體方向的系統(tǒng)可以拍攝照片,并能夠相應(yīng)地掌握和調(diào)整物體。”
在未來,團(tuán)隊(duì)希望將系統(tǒng)改進(jìn)到能夠執(zhí)行特定任務(wù)的地方,更深入地了解相應(yīng)的對象,例如學(xué)習(xí)如何抓住對象并將其移動(dòng)到最終目標(biāo),即清理桌面。