您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-26 10:48:52 來源:
新算法可以使家用機器人更好地識別雜亂環(huán)境中的對象
對于實用的家用機器人,他們需要能夠識別他們應(yīng)該操縱的物體。雖然物體識別是人工智能中研究最廣泛的 主題之一,但即使最好的物體探測器在很多時候仍然會失效。
麻省理工學(xué)院計算機科學(xué)與人工智能實驗室的研究人員認為,家庭機器人應(yīng)該利用其移動性和相對靜態(tài)的環(huán)境,通過在對身份做出判斷之前從多個角度對物體進行成像,使對象識別更容易。然而,匹配不同圖像中描繪的對象會帶來其自身的計算挑戰(zhàn)。
在即將出版的國際機器人研究期刊上發(fā)表的一篇論文中,麻省理工學(xué)院的研究人員表明,使用現(xiàn)成算法聚合不同視角的系統(tǒng)可以識別出使用單一視角的對象的四倍,同時減少錯誤識別的數(shù)量。
然后,他們提出了一種新算法,該算法同樣準確,但在某些情況下,速度提高了10倍,這使得它更適用于家用機器人的實時部署。
“如果你只是從一個角度觀察它的輸出,就會有很多東西可能會丟失,或者它可能是照明角度或阻擋物體的東西導(dǎo)致探測器出現(xiàn)系統(tǒng)誤差,”勞森說。 Wong,電氣工程和計算機科學(xué)專業(yè)的研究生,也是新論文的第一作者。“解決這個問題的方法就是四處走動,走向另一個觀點。”
第一次刺傷
Wong和他的論文顧問 - 松下計算機科學(xué)與工程教授Leslie Kaelbling和卓越教學(xué)工程學(xué)院教授TomásLozano-Pérez認為他們有20到30個不同的家庭對象圖像聚集在一起一張桌子。在幾個場景中,聚類包括相同對象的多個實例,緊密堆積在一起,這使得匹配不同視角的任務(wù)更加困難。
他們嘗試的第一種算法是為雷達等跟蹤系統(tǒng)開發(fā)的,它還必須確定在不同時間成像的物體是否實際上是相同的。“這已經(jīng)存在了幾十年,”Wong說。“這有一個很好的理由,那就是它真的很好用。這是大多數(shù)人想到的第一件事。“
對于每對連續(xù)圖像,該算法產(chǎn)生多個假設(shè),其中一個對象中的哪個對象與另一個中的哪些對象相對應(yīng)。問題在于增加了假設(shè)的數(shù)量作為新的觀點。為了保持計算的可管理性,算法會在每個步驟中丟棄除其頂部假設(shè)之外的所有假設(shè)。即便如此,在生成最后一個假設(shè)之后對它們進行排序是一項耗時的任務(wù)。
代表性抽樣
為了獲得更有效的算法,麻省理工學(xué)院的研究人員采用了不同的方法。他們的算法不會丟棄它在連續(xù)圖像中產(chǎn)生的任何假設(shè),但它也不會嘗試將它們?nèi)坷鰜?。相反,它隨機抽樣。由于不同假設(shè)之間存在顯著重疊,因此足夠數(shù)量的樣本通常會對任何兩個連續(xù)圖像中的對象之間的對應(yīng)關(guān)系產(chǎn)生共識。
為了保持所需的樣本數(shù)量較少,研究人員采用了一種簡化的技術(shù)來評估假設(shè)。假設(shè)算法從一個視角識別出三個對象,從另一個視角識別出四個對象。比較假設(shè)的數(shù)學(xué)上最精確的方法是考慮兩組對象之間的每個可能的匹配集:第一個視圖中的對象1,2和3與第二個對象中的對象1,2和3匹配的集合; 第一個中的對象1,2和3與第二個中的對象1,2和4匹配的集合; 將第一個視圖中的對象1,2和3與第二個視圖中的對象1,3和4匹配的集合,依此類推。在這種情況下,如果您包含檢測器發(fā)生錯誤的可能性以及某些對象從某些視圖中被遮擋,則該方法將產(chǎn)生304個不同的匹配集。
相反,研究人員的算法分別考慮第一組中的每個對象,并評估其映射到第二組中的對象的可能性。因此,第一組中的對象1可以映射到第二組中的對象1,2,3或4,對象2也是如此,依此類推。同樣,考慮到錯誤和遮擋的可能性,這種方法僅需要20次比較。
然而,它確實打開了無意義結(jié)果的大門。該算法可以得出結(jié)論,第二組中對象3的最可能匹配是第一組中的對象3 - 并且還可以得出結(jié)論,第二組中對象4的最可能匹配是第一組中的對象3。因此研究人員的算法也會尋找這樣的雙重映射并重新評估它們。這需要額外的時間,但不會像考慮聚合映射那樣多。在這種情況下,算法將執(zhí)行32次比較 - 超過20次,但明顯少于304次。