日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-23 08:22:19 來源:

        模型可以幫助機器人更像人類一樣導航

        導讀 當人群穿過人群達到最終目標時,人們通??梢园踩伛{駛空間而不必過多考慮。他們可以從他人的行為中學習,并注意要避免的任何障礙。另一方

        當人群穿過人群達到最終目標時,人們通??梢园踩伛{駛空間而不必過多考慮。他們可以從他人的行為中學習,并注意要避免的任何障礙。另一方面,機器人與這種導航概念斗爭。

        麻省理工學院的研究人員現(xiàn)在已經設計出一種方法來幫助機器人駕駛環(huán)境,就像人類一樣。他們新穎的運動規(guī)劃模型讓機器人通過探索環(huán)境,觀察其他代理人以及利用他們在類似情況下學到的知識來確定如何達到目標。在本周的IEEE / RSJ智能機器人和系統(tǒng)國際會議(IROS)上發(fā)表了描述該模型的論文。

        流行的運動規(guī)劃算法將創(chuàng)建一個可能的決策樹,分支出來直到找到良好的導航路徑。例如,需要導航房間到達門的機器人將創(chuàng)建可能移動的逐步搜索樹,然后考慮各種約束來執(zhí)行到門的最佳路徑。然而,一個缺點是這些算法很少學習:機器人無法利用有關他們或其他代理人之前在類似環(huán)境中如何行動的信息。

        “就像在下棋時一樣,這些決定分支出來,直到[機器人]找到一個好的導航方式。但是與國際象棋選手不同,[機器人]在不了解他們的環(huán)境和其他代理人的情況下探索未來的樣子,“共同作者,麻省理工學院計算機科學與人工智能實驗室(CSAIL)研究員兼研究中心的安德烈巴布說。麻省理工學院麥戈文研究所的大腦,思想和機器(CBMM)。“他們經歷同一群人的第一千次就像第一次一樣復雜。他們總是在探索,很少觀察,也從不使用過去發(fā)生過的事情。“

        研究人員開發(fā)了一種模型,該模型將規(guī)劃算法與神經網絡相結合,學習識別可以產生最佳結果的路徑,并利用這些知識指導機器人在環(huán)境中的運動。

        在他們的論文“ 用于基于抽樣的計劃的深度序列模型 ”中,研究人員在兩種情況下展示了他們模型的優(yōu)勢:在具有陷阱和狹窄通道的挑戰(zhàn)性房間中導航,以及在避免與其他代理人碰撞的同時導航區(qū)域。一個有前途的實際應用程序正在幫助自動駕駛汽車導航交叉路口,他們必須在合并到交通之前快速評估其他人將要做的事情。研究人員目前正在通過Toyota-CSAIL聯(lián)合研究中心進行此類應用。

        “當人類與世界互動時,我們會看到一個我們之前與之互動的對象,或者我們以前曾經去過的某個地方,所以我們知道我們將如何行動,”Yen-Ling Kuo說道, CSAIL博士和論文第一作者。“這項工作背后的想法是在搜索領域增加一個機器學習模型,該模型從過去的經驗中了解如何提高規(guī)劃效率。”

        Boris Katz是CSAIL的首席研究科學家和InfoLab Group的負責人,也是該論文的共同作者。

        交易勘探和開采

        傳統(tǒng)的運動規(guī)劃師通過快速擴展最終覆蓋整個空間的決策樹來探索環(huán)境。然后機器人查看樹以找到到達目標的方式,例如門。然而,研究人員的模型提供了“在探索世界和利用過去的知識之間進行權衡”,Kuo說。

        學習過程從幾個例子開始。使用該模型的機器人通過幾種方式進行訓練以導航類似的環(huán)境。神經網絡通過解釋機器人周圍的環(huán)境來學習使這些例子成功的原因,例如墻壁的形狀,其他代理人的行為以及目標的特征。簡而言之,該模型“得知當你被困在一個環(huán)境中,并且你看到一個門口時,通過門出去可能是一個好主意,”巴布說。

        該模型將早期方法的探索行為與此學習信息相結合?;A規(guī)劃師名為RRT *,由麻省理工學院教授Sertac Karaman和Emilio Frazzoli開發(fā)。(它是廣泛使用的運動規(guī)劃算法的一種變體,稱為快速探索隨機樹或RRT。)規(guī)劃器創(chuàng)建一個搜索樹,而神經網絡鏡像每個步驟,并對機器人應該下一步的位置進行概率預測。當網絡以高可信度進行預測時,基于學習的信息,它引導機器人進入新的路徑。如果網絡沒有很高的可信度,那么它就可以讓機器人探索環(huán)境,就像傳統(tǒng)的計劃者一樣。

        例如,研究人員在稱為“蟲陷阱”的模擬中展示了該模型,其中2-D機器人必須通過中央狹窄通道從內腔逃離并到達周圍較大房間的位置。通道兩側的盲目盟友可以讓機器人卡住。在這個模擬中,機器人接受了一些如何逃避不同的陷阱的訓練。當面對一個新陷阱時,它會識別陷阱的特征,逃脫,并繼續(xù)在較大的房間中搜索其目標。神經網絡幫助機器人找到陷阱的出口,識別死角,并讓機器人感知周圍環(huán)境,以便快速找到目標。

        本文中的結果基于在一段時間后找到路徑的機會,達到給定目標的路徑的總長度以及路徑的一致性。在這兩種模擬中,研究人員的模型更快速地繪制了比傳統(tǒng)規(guī)劃者更短且更一致的路徑。

        使用多個代理

        在另一項實驗中,研究人員在具有多個移動代理的導航環(huán)境中訓練和測試了該模型,這對于自動駕駛汽車尤其是導航交叉路口和環(huán)形交叉路口是一種有用的測試。在模擬中,有幾個特工圍繞著一個障礙物。機器人代理必須成功導航其他代理,避免碰撞,并到達目標位置,例如環(huán)形交叉口的出口。

        “像環(huán)形交叉路口這樣的情況很難,因為他們需要推理其他人如何回應你的行為,然后你將如何回應他們的行為,接下來會做什么,等等,”巴布說。“你最終發(fā)現(xiàn)你的第一個動作是錯誤的,因為稍后它會導致可能的意外。你必須應對的汽車越多,這個問題就會越來越嚴重。“

        結果表明,研究人員的模型可以捕獲關于其他代理人(汽車)未來行為的足夠信息,以便盡早切斷過程,同時仍然在導航中做出正確的決定。這使計劃更有效率。此外,他們只需要在幾個只有幾輛車的環(huán)形交叉口的例子上訓練模型。“機器人制定的計劃考慮到了其他車輛將會做什么,就像任何人一樣,”巴布說。

        穿越十字路口或環(huán)形交叉路口是自動駕駛汽車面臨的最具挑戰(zhàn)性的場景之一。據研究人員稱,這項工作可能有一天會讓汽車了解人類的行為以及如何適應不同環(huán)境中的駕駛員。這是豐田 - CSAIL聯(lián)合研究中心工作的重點。

        “并不是每個人的行為方式都相同,但人們卻非??贪?。有些人害羞,有些人很有侵略性。該模型很快意識到這一點,這就是它可以有效規(guī)劃的原因,“巴布說。

        最近,研究人員一直將這項工作應用于機械手,這些機械手在不斷變化的環(huán)境中接觸物體時面臨同樣嚴峻的挑戰(zhàn)。