您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-03 09:10:34 來源:
從錯誤和可轉(zhuǎn)移的技能中學習工人機器人的屬性
實踐是完美的-它是一句格言,已幫助人類變得高度靈巧,現(xiàn)在,它已被應(yīng)用于機器人。利茲大學的計算機科學家正在使用自動計劃和強化學習的人工智能(AI)技術(shù)來“訓練”機器人,以在雜亂的空間(例如倉庫架子或冰箱)中找到物體并進行移動。
目的是發(fā)展機器人自主性,以便機器可以評估任務(wù)中出現(xiàn)的獨特情況并找到解決方案,類似于機器人將技能和知識轉(zhuǎn)移到新問題上。
利茲大學的研究人員今天(11月4日,星期一)在中國澳門舉行的智能機器人與系統(tǒng)國際會議上介紹他們的發(fā)現(xiàn)。
最大的挑戰(zhàn)是,在狹窄的區(qū)域中,機械臂可能無法從上方抓取物體。取而代之的是,它可能必須計劃一系列移動以到達目標對象,這可能是通過操縱其他項目來實現(xiàn)的。計劃此類任務(wù)所需的計算機功能非常強大,機器人通常會暫停幾分鐘。當它執(zhí)行移動時,通常會失敗。
不斷發(fā)展實踐的想法非常完美,利茲的計算機科學家們將AI的兩個想法融合在一起。
一種是自動化計劃。機器人能夠通過視覺系統(tǒng)“看到”問題,實際上是圖像。機器人操作系統(tǒng)中的軟件可模擬其可能到達目標物體的一系列動作。
但是,機器人“預(yù)演”的模擬無法捕獲現(xiàn)實世界的復(fù)雜性,并且在實施模擬時,機器人無法執(zhí)行任務(wù)。例如,它可以將物品從架子上敲下來。
因此,利茲團隊已將計劃與另一種稱為強化學習的AI技術(shù)相結(jié)合。
強化學習需要計算機嘗試一系列嘗試和錯誤嘗試(總共約10,000次)才能到達并移動對象。通過這些嘗試和錯誤嘗試,機器人可以“學習”其計劃好的動作更有可能成功結(jié)束。
計算機自行進行學習,首先隨機選擇可能有效的計劃動作。但是隨著機器人從反復(fù)試驗中學到東西,它變得更加善于選擇那些更有可能成功的計劃動作。
計算學院的Matteo Leonetti博士說:“人工智能擅長使機器人進行推理-例如,我們已經(jīng)看到與大師級棋子有關(guān)的機器人。
“但是機器人不能很好地發(fā)揮人類的才能:高度機動和靈巧。那些物理技能已經(jīng)硬連接到人腦,這是進化的結(jié)果以及我們實踐和實踐的方式。
“這就是我們將其應(yīng)用于下一代機器人的想法。”
據(jù)Wissam Bejjani博士說。撰寫研究論文的學生,該機器人發(fā)展了概括能力,可以將其計劃應(yīng)用到獨特的環(huán)境中。
他說:“我們的工作意義重大,因為它將計劃與強化學習相結(jié)合。許多嘗試開發(fā)該技術(shù)的研究都只是其中一種方法。
“我們的方法已經(jīng)在大學的機器人實驗室中看到的結(jié)果得到驗證。
“有一個問題,在機器人必須移動一個大蘋果的情況下,它首先要移到蘋果的左側(cè)以移開雜物,然后再操縱蘋果。
“這樣做的目的是使雜物不會落在架子的邊界之外。”
計算學院副教授Mehmet Dogar博士也參與了這項研究。他說,這種方法將機器人的“思考”時間加快了十倍,而決定要花50秒,現(xiàn)在要花5秒。