您現(xiàn)在的位置是:首頁(yè) >生活 > 2021-04-09 10:30:25 來(lái)源:
麻省理工學(xué)院CSAIL使用AI教授機(jī)器人操縱他們以前從未見(jiàn)過(guò)的物體
人工智能(AI)比機(jī)器人技術(shù)更徹底地改造了很少的領(lǐng)域??偛课挥谂f金山的創(chuàng)業(yè)公司OpenAI開(kāi)發(fā)了一個(gè)模型,指導(dǎo)機(jī)械手以最先進(jìn)的精度操縱物體,Softbank Robotics最近利用情感分析公司Affectiva為其Pepper機(jī)器人注入情商。
最新進(jìn)展來(lái)自麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員,他們今天在一篇論文(“ 密集對(duì)象網(wǎng):學(xué)習(xí)密集視覺(jué)對(duì)象
描述符和應(yīng)用于機(jī)器人操作”)中詳述了計(jì)算機(jī)視覺(jué)系統(tǒng)。 - 被稱(chēng)為密集對(duì)象網(wǎng) - 允許機(jī)器人檢查,視覺(jué)理解和操縱他們以前從未見(jiàn)過(guò)的物體。
該團(tuán)隊(duì)計(jì)劃于10月在瑞士蘇黎世召開(kāi)的機(jī)器人學(xué)習(xí)會(huì)議上展示他們的研究成果。
“許多操縱方法無(wú)法識(shí)別對(duì)象可能遇到的多個(gè)方向的特定部分,”該論文的第一作者,博士生Lucas Manuelli在麻省理工學(xué)院CSAIL網(wǎng)站上發(fā)表的博客文章中表示。“例如,現(xiàn)有的算法無(wú)法通過(guò)手柄抓住馬克杯,特別是如果馬克杯可能處于多個(gè)方向,如直立或側(cè)面。
DON不是控制系統(tǒng)。相反,它是一種自我監(jiān)督的深度神經(jīng)網(wǎng)絡(luò) - 分層算法,模仿大腦中神經(jīng)元的功能 - 經(jīng)過(guò)訓(xùn)練,以精確坐標(biāo)的形式生成對(duì)象的描述。在訓(xùn)練之后,它能夠自主地挑選出參考框架,并且當(dāng)呈現(xiàn)新物體時(shí),將它們一起映射以在三維中可視化它們的形狀。
根據(jù)研究人員的說(shuō)法,對(duì)象描述符平均需要20分鐘才能學(xué)習(xí),并且它們與任務(wù)無(wú)關(guān) - 也就是說(shuō),它們適用于剛性物體(如帽子)和非剛性物體(長(zhǎng)毛絨)玩具)。(在一輪訓(xùn)練中,系統(tǒng)在僅看到六種不同類(lèi)型之后就學(xué)會(huì)了帽子的描述。)
此外,盡管對(duì)象顏色,紋理和形狀存在差異,但描述符仍保持一致,這使得DON在使用RGB或深度數(shù)據(jù)的模型上占了一席之地。因?yàn)楹笳邲](méi)有一致的對(duì)象表示并且有效地尋找“可抓取的”特征,所以它們?cè)诰哂猩踔凛p微變形的對(duì)象上找不到這樣的點(diǎn)。
“在工廠中,機(jī)器人通常需要復(fù)雜的零件供料器才能可靠地工作,”Manuelli說(shuō)。“但是像這樣能夠理解物體方向的系統(tǒng)可以拍攝照片,并能夠相應(yīng)地掌握和調(diào)整物體。”
在測(cè)試中,團(tuán)隊(duì)在參考圖像中選擇了一個(gè)像素,供系統(tǒng)自動(dòng)識(shí)別。然后他們使用Kuka手臂孤立地抓住物品(毛毛蟲(chóng)玩具),特定類(lèi)別中的物品(不同種類(lèi)的運(yùn)動(dòng)鞋),雜物中的物體(穿著其他鞋子的鞋子)。
在一次演示中,盡管從未在訓(xùn)練數(shù)據(jù)中看到帽子的照片,機(jī)器人手臂設(shè)法從一堆類(lèi)似的帽子中抓出一頂帽子。另一方面,它從一系列配置中抓住了毛毛蟲(chóng)玩具的右耳,證明它可以在對(duì)稱(chēng)物體上區(qū)分左右。
“我們觀察到,對(duì)于各種各樣的物體,我們可以獲得在視點(diǎn)和配置上一致的密集描述符,”研究人員寫(xiě)道。“各種物體包括適度變形的物體,例如柔軟的毛絨玩具,鞋子,馬克杯和帽子,并且可以包括非常低質(zhì)感的物體。其中許多物品都是從實(shí)驗(yàn)室周?chē)ト〉?包括作者和同事的鞋子和帽子),我們對(duì)各種物體印象深刻,可以用相同的網(wǎng)絡(luò)架構(gòu)可靠地學(xué)習(xí)一致的密集視覺(jué)模型。訓(xùn)練。”
該團(tuán)隊(duì)認(rèn)為DON可能在工業(yè)環(huán)境中很有用(想想物體分類(lèi)倉(cāng)庫(kù)機(jī)器人),但它希望開(kāi)發(fā)一個(gè)更強(qiáng)大的版本,可以通過(guò)“更深入地理解”相應(yīng)的對(duì)象來(lái)執(zhí)行任務(wù)。
研究人員寫(xiě)道:“我們認(rèn)為密集物體網(wǎng)是一種新穎的物體表現(xiàn)形式,可以實(shí)現(xiàn)機(jī)器人操作的許多新方法。” “我們有興趣探索解決操縱問(wèn)題的新方法,這些問(wèn)題利用了學(xué)習(xí)密集描述符提供的密集視覺(jué)信息,以及[看到]這些密集描述符如何有益于其他類(lèi)型的機(jī)器人學(xué)習(xí),例如學(xué)習(xí)如何掌握,操縱和放置一組感興趣的物體。
上一篇:Xilinx將在FPGA芯片中使用Arm內(nèi)核
下一篇:高通公司的Snapdragon Wear 3100智能手表芯片組可承受長(zhǎng)達(dá)2天的電池續(xù)航時(shí)間