日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >人工智能 > 2021-04-26 16:40:50 來源:

        機器人隊或其他多代理系統(tǒng)能所未有的方式進行協(xié)作

        導(dǎo)讀 編寫程序來控制使用不穩(wěn)定的通信鏈路導(dǎo)航不確定環(huán)境的單個自主機器人是很困難的; 為多個機器人編寫一個可能需要或可能不必同時工作的機器

        編寫程序來控制使用不穩(wěn)定的通信鏈路導(dǎo)航不確定環(huán)境的單個自主機器人是很困難的; 為多個機器人編寫一個可能需要或可能不必同時工作的機器人,這取決于任務(wù),甚至更難。

        因此,為“多代理系統(tǒng)”設(shè)計控制程序的工程師 - 無論是機器人團隊還是具有不同功能的設(shè)備網(wǎng)絡(luò) - 通常都將自己局限于特殊情況,可以假設(shè)有關(guān)環(huán)境的可靠信息或相對簡單的協(xié)作任務(wù)事先明確說明。

        今年5月,在麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(CSAIL)的研究人員將在自動代理和多代理系統(tǒng)國際會議上展示一種新系統(tǒng),將現(xiàn)有控制程序拼接在一起,使多代理系統(tǒng)能夠以更復(fù)雜的方式進行協(xié)作。系統(tǒng)因素存在不確定性 - 例如,通信鏈路將丟失的可能性,或特定算法將無意中引導(dǎo)機器人進入死胡同的可能性 - 并自動計劃它周圍。

        對于小型協(xié)作任務(wù),系統(tǒng)可以保證其程序組合是最佳的 - 考慮到環(huán)境的不確定性和程序本身的局限性,它將產(chǎn)生最佳結(jié)果。

        不確定條件下多機器人分散控制的規(guī)劃

        視頻由研究人員提供

        研究人員與Jon How,Richard Cockburn Maclaurin航空航天教授和他的學(xué)生Chris Maynor一起,正在模擬倉庫應(yīng)用程序中測試他們的系統(tǒng),其中機器人團隊需要從不確定的方向檢索任意對象地點,根據(jù)需要協(xié)同運輸重物。模擬涉及一小組iRobot Creates,可編程機器人與Roomba真空吸塵器具有相同的底盤。

        合理的懷疑

        “在[多代理]系統(tǒng)中,一般來說,在現(xiàn)實世界中,他們很難有效地進行交流,”CSAIL的博士后和新論文的第一作者Christopher Amato說。“如果你有一臺攝像機,攝像機就不可能不斷地將所有信息傳輸?shù)剿衅渌麛z像機。同樣地,機器人在網(wǎng)絡(luò)上是不完美的,因此需要花費一些時間來向其他機器人發(fā)送消息,并且在某些情況下他們可能無法在障礙物周圍進行通信。“

        Amato說,代理商可能甚至沒有關(guān)于其自身位置的完美信息 - 例如,它實際上是倉庫的哪個過道。此外,“當(dāng)你試圖做出決定時,對于將如何展開存在一些不確定性,”他說。“也許你試圖向某個方向移動,并且存在風(fēng)或車輪滑移,或者由于數(shù)據(jù)包丟失而導(dǎo)致網(wǎng)絡(luò)存在不確定性。因此,在這些真實世界的領(lǐng)域,所有這些溝通的噪音和對發(fā)生的事情的不確定性,很難做出決定。“

        Amato與共同作者松下計算機科學(xué)與工程教授Leslie Kaelbling以及博士后同事George Konidaris共同開發(fā)的新MIT系統(tǒng)需要三個輸入。一種是一套低級控制算法 - 麻省理工學(xué)院的研究人員將其稱為“宏觀行動” - 可以統(tǒng)一或單獨地管理代理人的行為。第二個是關(guān)于這些程序在特定環(huán)境中執(zhí)行的一組統(tǒng)計信息。第三個是評估不同結(jié)果的方案:完成任務(wù)會產(chǎn)生高估值,但消耗能量會產(chǎn)生負面估值。

        學(xué)校的硬敲

        Amato設(shè)想可以通過簡單地讓多代理系統(tǒng)運行一段時間來自動收集統(tǒng)計數(shù)據(jù) - 無論是在現(xiàn)實世界中還是在模擬中。例如,在倉儲應(yīng)用程序中,機器人將被執(zhí)行各種宏操作,系統(tǒng)將收集結(jié)果數(shù)據(jù)。試圖從倉庫中的A點移動到B點的機器人可能會在一定比例的時間內(nèi)落到一條死胡同中,并且他們的通信帶寬可能會在其他百分比的時間內(nèi)下降; 對于從B點移動到C點的機器人,這些百分比可能會有所不同。

        麻省理工學(xué)院系統(tǒng)采用這些輸入,然后決定如何最好地組合宏動作以最大化系統(tǒng)的價值功能。它可能會使用所有宏觀行動; 它可能只使用一小部分。它可能會以人類設(shè)計師無法想到的方式使用它們。

        例如,假設(shè)每個機器人都有一小組彩色燈,如果無線鏈路斷開,它可以用來與對方進行通信。“通常發(fā)生的事情是,程序員決定紅燈意味著去這個房間并幫助某人,綠燈意味著去那個房間并幫助某人,”阿馬托說。“在我們的例子中,我們可以說有三個燈,算法是否會使用它們以及每種顏色的含義。”

        麻省理工學(xué)院的研究人員的工作將多智能體控制的問題定義為部分可觀察的馬爾可夫決策過程或POMDP。“POMDP,尤其是Dec-POMDP,它們是分散版本,對于真正的多機器人問題來說基本上是難以處理的,因為它們?nèi)绱藦?fù)雜且計算成本太高而無法在增加機器人數(shù)量時爆炸,”Nora Ayanian說,南加州大學(xué)計算機科學(xué)助理教授,專門研究多機器人系統(tǒng)。“所以他們在多機器人世界中并不是很受歡迎。”

        “通常情況下,當(dāng)你使用這些Dec-POMDP時,你的工作粒度非常低,”她解釋道。“這篇論文的有趣之處在于它們采用了這些非常復(fù)雜的工具,并降低了分辨率。”

        “這肯定會使這些POMDP成為多機器人系統(tǒng)的雷達,”Ayanian補充道。“它確實能夠更好地應(yīng)用于復(fù)雜問題。”