您現(xiàn)在的位置是:首頁 >人工智能 > 2022-03-15 14:48:31 來源:
局部場(chǎng)景中對(duì)象定位的空間常識(shí)圖
未觀察到的物體的定位是一項(xiàng)對(duì)許多自動(dòng)化應(yīng)用很有用的任務(wù),例如幫助視力受損的人尋找日常物品或視覺搜索具身代理。人類不僅使用部分觀察到的環(huán)境,而且依靠常識(shí)知識(shí)來執(zhí)行這項(xiàng)任務(wù)。例如,知道枕頭經(jīng)??拷?,我們可以推斷枕頭的下落。
arXiv.org最近的一篇論文提出了空間常識(shí)圖(SCG),這是一種新的場(chǎng)景圖表示。它具有異構(gòu)節(jié)點(diǎn)和邊緣,將常識(shí)知識(shí)與對(duì)象的空間鄰近性嵌入在一起。
為了解決定位問題,提出了SCGObjectLocaliser。首先,估計(jì)看不見的物體和所有已知物體之間的距離。然后,它們用于基于圓形交叉點(diǎn)的定位。
我們解決了部分場(chǎng)景中的對(duì)象定位問題,這是一個(gè)在給定場(chǎng)景的部分3D掃描的情況下估計(jì)對(duì)象的未知位置(例如包在哪里?)的新問題。所提出的解決方案基于一種新穎的場(chǎng)景圖模型,即空間常識(shí)圖(SCG),其中對(duì)象是節(jié)點(diǎn),邊定義了它們之間的成對(duì)距離,并通過常識(shí)知識(shí)庫中的概念節(jié)點(diǎn)和關(guān)系進(jìn)行了豐富。這使得SCG能夠更好地概括其對(duì)未知3D場(chǎng)景的空間推斷。SCG用于通過兩個(gè)步驟估計(jì)目標(biāo)對(duì)象的未知位置:首先,我們將SCG輸入一個(gè)新穎的ProximityPredictionNetwork,這是一種使用注意力來執(zhí)行表示目標(biāo)對(duì)象的節(jié)點(diǎn)與目標(biāo)對(duì)象之間的距離預(yù)測(cè)的圖神經(jīng)網(wǎng)絡(luò)。表示SCG中觀察到的對(duì)象的節(jié)點(diǎn);第二,我們提出了一個(gè)基于圓形相交的定位模塊,以使用所有預(yù)測(cè)的成對(duì)距離來估計(jì)對(duì)象位置,以便獨(dú)立于任何參考系統(tǒng)。我們創(chuàng)建了一個(gè)部分重建場(chǎng)景的新數(shù)據(jù)集,以對(duì)我們的方法和部分場(chǎng)景中目標(biāo)定位的基線進(jìn)行基準(zhǔn)測(cè)試,其中我們提出的方法實(shí)現(xiàn)了最佳定位性能。