您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-09 15:21:31 來源:
宜家家具組裝環(huán)境可對機器人進行復雜的操作任務進行培訓
為了完成復雜的日常任務,例如使用設備,烹飪或建造家具,機器人應該能夠計劃其動作并操縱周圍的物體。但是,到目前為止,由于缺乏可靠的模擬環(huán)境來測試機器人,教機器人完成復雜的任務(例如需要在相當長的時間內(nèi)進行計劃的任務)非常具有挑戰(zhàn)性。
考慮到這一點,南卡羅來納大學的研究人員最近開發(fā)了宜家家具組裝環(huán)境,這是一個模擬平臺,研究人員可以在其中測試復雜操作任務上的人工智能(AI)代理。在arXiv上發(fā)表的論文中介紹的他們開發(fā)的環(huán)境中,可以對代理進行各種操作任務的評估,這些任務涉及構建和操作不同的家具。
研究人員在論文中寫道:“該環(huán)境旨在將強化學習從簡單的玩具任務推進到需要長期計劃和復雜的低級控制的復雜任務。”
即使對于人類來說,組裝家具也可能是一項艱巨的任務,因為它通常需要長期的規(guī)劃和復雜的操作技能。研究人員開發(fā)的環(huán)境非常易于使用,具有一些有趣的功能。由于它會生成大量的合成標記數(shù)據(jù),因此可以用于訓練計算機視覺模型來執(zhí)行各種任務,包括對象姿態(tài)估計,場景理解等,而無需人工注釋的數(shù)據(jù)。
此外,該環(huán)境可以用作設計用于家具組裝或其他長期操作任務的機器學習方法的基準,從而改善其控制和規(guī)劃能力。有趣的是,該平臺產(chǎn)生的視覺和交互式數(shù)據(jù)也可以用于獲取其他應用程序的特定領域知識,例如直觀的物理模型。
宜家家具組裝環(huán)境可支持80多種家具,并可通過背景圖像,照明和紋理進行定制。最終可以將其視為旨在為機器人提供高級對象操縱技能的機器學習技術的試驗臺。
到目前為止,該環(huán)境可以用于訓練或測試三個不同形狀和大小的機器人,稱為Cursor,Sawyer和Baxter。但是,在下一個更新中,研究人員還計劃增加對Fetch,UR,Jaco和其他流行機器人的支持。
將來,這種可自定義的環(huán)境可能會為培訓和評估機器人技術的眾多機器學習技術開辟新的可能性。同時,研究人員計劃更新該平臺并改善其某些功能。
例如,他們希望增加對3-D運動設備的支持,從而允許用戶遠程操作機器人并使用VR控制器或3-D鼠標創(chuàng)建演示視頻。然后,可以使用稱為模仿學習的策略,將這些演示視頻用于訓練機器學習模型。
在該平臺的未來版本中,還可以允許用戶通過語音指令來引導機器人,甚至可以同時訓練多個代理。而且,最終可以對機器人進行如何使用特定工具的培訓,例如螺絲刀和錘子。