您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-26 14:29:55 來源:
機器人的環(huán)境地圖可以使現(xiàn)有的物體識別算法更加準確
麻省理工學院機械工程系的John Leonard小組專門研究SLAM,或同步定位和制圖,這是一種移動自動機器人映射環(huán)境并確定其位置的技術。
上周,在機器人科學與系統(tǒng)會議上,倫納德小組成員發(fā)表了一篇新論文,展示了SLAM如何用于改進物體識別系統(tǒng),這將成為未來機器人的重要組成部分,這些機器人必須操縱周圍的物體。任意方式。
該系統(tǒng)使用SLAM信息來增強現(xiàn)有的對象識別算法。因此,隨著計算機視覺研究人員開發(fā)出更好的識別軟件,機器人專家開發(fā)出更好的SLAM軟件,其性能將不斷提高。
“將對象識別視為一個黑盒子,并將SLAM視為一個黑盒子,你如何以一種好的方式整合它們?”Sudeep Pillai問道,他是計算機科學與工程專業(yè)的研究生,也是新論文的第一作者。“你如何整合各個觀點的概率?這才是我們想要實現(xiàn)的目標。“
盡管使用現(xiàn)有的SLAM和物體識別算法,盡管僅使用普通攝像機的輸出,但系統(tǒng)的性能已經(jīng)與專用機器人物體識別系統(tǒng)的性能相當,后者可以考慮深度測量以及視覺信息。
當然,因為系統(tǒng)可以融合從不同攝像機角度捕獲的信息,所以它比試圖識別靜止圖像中的物體的物體識別系統(tǒng)更好。
繪制邊界
Pillai說,在猜測圖像包含哪些對象之前,較新的對象識別系統(tǒng)首先嘗試識別對象之間的邊界。在對顏色過渡的初步分析的基礎上,他們將圖像劃分為可能包含某種對象的矩形區(qū)域。然后他們將在每個矩形內(nèi)的像素上運行識別算法。
為了獲得良好的結果,經(jīng)典的物體識別系統(tǒng)可能必須重繪這些矩形數(shù)千次。例如,從某些角度來看,彼此相鄰的兩個物體可能看起來像一個,特別是如果它們的顏色相似。系統(tǒng)必須檢驗將它們混為一談的假設,以及將它們視為獨立的假設。
但是,由于SLAM圖是三維的,因此它可以更好地區(qū)分彼此接近的對象,而不是單視角分析。由機械和海洋工程教授Pillai和Leonard設計的系統(tǒng)使用SLAM圖來指導其相機捕獲的圖像的分割,然后將它們饋送到物體識別算法。因此,浪費假設的時間減少了。
更重要的是,SLAM數(shù)據(jù)允許系統(tǒng)關聯(lián)從不同視角捕獲的圖像的分割。分析可能從不同角度描繪相同對象的圖像片段可提高系統(tǒng)的性能。
圖片完美
利用機器學習,其他研究人員已經(jīng)構建了物體識別系統(tǒng),這些系統(tǒng)直接作用于由攝像機捕獲的數(shù)據(jù)構建的詳細3-D SLAM地圖,例如Microsoft Kinect,它也可以進行深度測量。但與那些系統(tǒng)不同,Pillai和Leonard的系統(tǒng)可以利用對標準相機捕獲的單視角圖像進行訓練的對象識別器的大量研究。
此外,Pillai和Leonard系統(tǒng)的性能已經(jīng)與使用深度信息的系統(tǒng)相媲美。而且它在室外更加可靠,像Kinect這樣依賴紅外線的深度傳感器實際上是無用的。
Pillai和Leonard的新論文描述了SLAM如何幫助改進物體檢測,但在正在進行的工作中,Pillai正在研究物體檢測是否可以同樣有助于SLAM。SLAM的核心挑戰(zhàn)之一就是機器人專家稱之為“循環(huán)閉合”。當一個機器人建立一個環(huán)境地圖時,它可能會發(fā)現(xiàn)它已經(jīng)存在于某個地方 - 例如,從另一扇門進入一個房間。機器人需要能夠識別先前訪問過的位置,以便它可以融合從不同視角獲取的地圖數(shù)據(jù)。
對象識別可以幫助解決這個問題。如果一個機器人進入一個房間找到一個會議桌,其中有一臺筆記本電腦,一個咖啡杯和一個筆記本電腦的一端,它可以推斷它是同一個會議室,它之前確定了一臺筆記本電腦,一個咖啡杯和一個筆記本近在咫尺。
“對于應該在日常環(huán)境中執(zhí)行有用任務的機器人來說,檢測物體的能力非常重要,”華盛頓大學計算機科學與工程教授Dieter Fox說。“這項工作顯示了一個非常有希望的結果,即機器人如何組合從多個視點觀察到的信息,以實現(xiàn)對物體的有效和強大的檢測。”