日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-26 17:17:51 來源:

        確定物體方向的算法可以幫助機(jī)器人進(jìn)行導(dǎo)航

        導(dǎo)讀 假設(shè)您正在嘗試瀏覽大城市中不熟悉的部分,并且您正在使用特定的摩天大樓群作為參考點。交通和單行道迫使你采取一些奇怪的轉(zhuǎn)彎,有一段時間

        假設(shè)您正在嘗試瀏覽大城市中不熟悉的部分,并且您正在使用特定的摩天大樓群作為參考點。交通和單行道迫使你采取一些奇怪的轉(zhuǎn)彎,有一段時間你會看不到你的地標(biāo)。當(dāng)它們重新出現(xiàn)時,為了將它們用于導(dǎo)航,您必須能夠?qū)⑺鼈冏R別為您之前跟蹤的相同建筑物 - 以及您相對于它們的方向。

        這種類型的重新識別是人類的第二天性,但對計算機(jī)來說卻很難。在6月的IEEE計算機(jī)視覺和模式識別會議上,麻省理工學(xué)院的研究人員將通過識別三維場景中的主要方向,提出一種新的算法,使其更加容易。相同的算法還可以簡化場景理解問題,這是計算機(jī)視覺研究的核心挑戰(zhàn)之一。

        該算法主要用于幫助機(jī)器人駕駛不熟悉的建筑物,而不是駕駛者在不熟悉的城市中航行,但原理是相同的。它的工作原理是識別給定場景中的主導(dǎo)方向,它表示為一組軸 - 稱為“曼哈頓幀” - 嵌入在一個球體中。當(dāng)機(jī)器人移動時,它實際上將觀察球體在相反方向上旋轉(zhuǎn),并且可以測量其相對于軸的方向。每當(dāng)它想要重新定位時,它就會知道它的哪些地標(biāo)的面應(yīng)該朝向它,使它們更容易識別。

        事實證明,相同的算法也極大地簡化了平面分割的問題,或者決定了視覺場景的哪些元素位于哪個平面的哪個深度。平面分割允許計算機(jī)在場景中構(gòu)建對象的四四方形模型 - 反過來,它可以與存儲的已知對象的三維模型匹配。

        麻省理工學(xué)院電子工程和計算機(jī)科學(xué)研究生Julian Straub是該論文的第一作者。他的顧問是麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室的高級研究科學(xué)家John Fisher,以及機(jī)械與海洋工程教授John Leonard,以及Fisher's Sensing,Learning的博士后Oren Freifeld和Guy Rosman。和推理組。

        研究人員的新算法適用于Microsoft Kinect或激光測距儀捕獲的三維數(shù)據(jù)。首先,使用已建立的程序,算法估計場景中的大量單個點的方向。然后將這些方向表示為球體表面上的點,每個點定義相對于球體中心的唯一角度。

        由于初始方向估計是粗略的,球體上的點形成松散的簇,這些簇很難區(qū)分。使用關(guān)于初始方向估計的不確定性的統(tǒng)計信息,算法然后嘗試將曼哈頓幀擬合到球體上的點。

        基本思想類似于回歸分析 - 找到最接近點分散的線條。但是球體的幾何形狀使它變得復(fù)雜。“大多數(shù)經(jīng)典統(tǒng)計數(shù)據(jù)都是基于線性和歐幾里德距離,因此你可以得到兩個點,你可以將它們相加,除以2,這將給你平均值,”Freifeld說。“但是一旦你在非線性空間中工作,當(dāng)你進(jìn)行平均化時,你就會落在空間之外。”

        例如,考慮測量地理距離的例子。“說你在東京,我在紐約,”弗雷菲爾德說。“我們不希望我們的平均值位于地球中部; 我們希望它在表面上。“新算法的關(guān)鍵之一是它將這些幾何結(jié)合到關(guān)于場景的統(tǒng)計推理中。

        原則上,通過使用數(shù)百個不同的曼哈頓幀可以非常精確地近似點數(shù)據(jù),但這會產(chǎn)生一個太復(fù)雜而無用的模型。因此,該算法的另一個方面是成本函數(shù),其權(quán)衡近似與幀數(shù)的準(zhǔn)確度。該算法以固定數(shù)量的幀開始 - 大約在3到10之間,具體取決于場景的預(yù)期復(fù)雜性 - 然后嘗試在不影響總體成本函數(shù)的情況下減少該數(shù)量。

        得到的曼哈頓幀集合可能不代表彼此略微錯位的對象之間的細(xì)微區(qū)別,但這些區(qū)別對于導(dǎo)航系統(tǒng)并不十分有用。“想想你如何導(dǎo)航房間,”費舍爾說。“你沒有建立一個精確的環(huán)境模型。你有點捕捉松散的統(tǒng)計數(shù)據(jù),這些統(tǒng)計數(shù)據(jù)允許你以一種你不會在椅子上絆倒的方式完成你的任務(wù)。“

        一旦確定了一組曼哈頓幀,平面分割的問題就變得容易得多。不占用大部分視野的物體 - 因為它們很小,很遠(yuǎn)或被遮擋 - 會給現(xiàn)有的平面分割算法帶來麻煩,因為它們產(chǎn)生的深度信息很少,無法可靠地推斷出它們的方向。但如果問題只是在少數(shù)幾種可能的方向中進(jìn)行選擇,而不是潛在的無限,那就變得更容易處理。

        喬治亞理工學(xué)院交互式計算教授弗蘭克德拉特爾沒有參與這項研究,稱這項工作“有趣”,并補充說它“推廣到非垂直框架,這在操縱環(huán)境中很重要,并且它適用于深度圖像,隨著Kinect和其他深度傳感器的興起而變得非常受歡迎。“

        “我相信應(yīng)該應(yīng)用這些技術(shù),”Dellaert說。“無論他們是否愿意,取決于那些最終將在大規(guī)模生產(chǎn)的自動系統(tǒng)中實施和部署這些技術(shù)的公司所看到的增值價值,無論是家用機(jī)器人還是自動駕駛汽車。在算法通用性和一定量的復(fù)雜性之間總是存在權(quán)衡以利用諸如人造結(jié)構(gòu)之類的約束。在目前的情況下,我認(rèn)為使用這些約束的優(yōu)勢是顯著的,并將在未來的自治系統(tǒng)中得到利用。“