您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-18 16:39:44 來源:
深度學(xué)習(xí)機(jī)器人邁出的一大步
可以通過人工智能和自適應(yīng)學(xué)習(xí)自行學(xué)習(xí)的機(jī)器人的前景吸引了科學(xué)家和電影迷。諸如《短路》,《終結(jié)者》,《千禧一代》,《嬉皮》和《前任機(jī)械男》等電影都在調(diào)侃機(jī)器智能的想法,超越了設(shè)定程序的限制。Pieter Abbeel的任務(wù)是創(chuàng)建能夠做到這一點(diǎn)的架構(gòu)。他是越來越多的探索深度機(jī)器學(xué)習(xí)的科學(xué)家隊(duì)伍的一部分。
如今,可以對機(jī)器人進(jìn)行編程,以反復(fù)可靠地執(zhí)行簡單的任務(wù),例如在裝配線上安裝零件。但是,可以在沒有特定說明的情況下對變化的條件做出適當(dāng)響應(yīng)的機(jī)器人仍然是個(gè)遙不可及的目標(biāo)。
可以從經(jīng)驗(yàn)中學(xué)習(xí)的機(jī)器人將比需要為每個(gè)新動(dòng)作提供詳細(xì)的內(nèi)置指令的機(jī)器人多用途。它可以依靠人工智能研究人員所說的深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
深度學(xué)習(xí)使機(jī)器人能夠感知其直接環(huán)境,包括其四肢的位置和運(yùn)動(dòng)。強(qiáng)化學(xué)習(xí)意味著通過反復(fù)試驗(yàn)來改進(jìn)一項(xiàng)任務(wù)。具有這兩種技能的機(jī)器人可以基于實(shí)時(shí)反饋來改善其性能。
在過去的15年中,伯克利機(jī)器人研究員Pieter Abbeel一直在尋找使機(jī)器人學(xué)習(xí)的方法。在2010年,他和他的學(xué)生對一個(gè)名為BRETT(消除繁瑣任務(wù)的伯克利機(jī)器人)的機(jī)器人進(jìn)行了編程,以拾取不同尺寸的毛巾,弄清楚它們的形狀并將其整齊地折疊。
關(guān)鍵指令使機(jī)器人在用一個(gè)抓具抓握時(shí)能看到毛巾的li行形狀,而在用兩個(gè)抓具抓握時(shí)能看到其輪廓??雌饋硭坪醪欢?,但機(jī)器人面臨的挑戰(zhàn)是艱巨的。經(jīng)過多達(dá)一百次試驗(yàn)-每次都在不同的地方握住一條毛巾-BRETT知道毛巾的大小和形狀,可以開始折疊。YouTube上關(guān)于BRETT技能的視頻被觀看了數(shù)十萬次。
電氣工程和計(jì)算機(jī)科學(xué)副教授Abbeel笑著說:“算法指示機(jī)器人在一組非常特定的條件下運(yùn)行,盡管成功了,但折疊每條毛巾卻花了20分鐘。”
“我們退后一步,問'如何使機(jī)器人具備完善新技能的能力變得更容易,以便我們可以將學(xué)習(xí)過程應(yīng)用于許多不同的技能?”
今年,Abbeel首次向該領(lǐng)域提供了新版本的BRETT,使其能夠通過深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)來提高其性能。深度學(xué)習(xí)組件使用所謂的神經(jīng)網(wǎng)絡(luò)為控制機(jī)器人運(yùn)動(dòng)的軟件提供瞬間到瞬間的視覺和感覺反饋。