日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-11 08:17:23 來源:

        深度強化學習架構(gòu)結(jié)合了預(yù)先學習的技能

        導讀 來自愛丁堡大學和浙江大學的一組研究人員已經(jīng)開發(fā)出一種方法,可以將深度神經(jīng)網(wǎng)絡(luò)(DNN)組合在一起,以創(chuàng)建一種具有新型學習能力的新型系統(tǒng)

        來自愛丁堡大學和浙江大學的一組研究人員已經(jīng)開發(fā)出一種方法,可以將深度神經(jīng)網(wǎng)絡(luò)(DNN)組合在一起,以創(chuàng)建一種具有新型學習能力的新型系統(tǒng)。該小組在《科學機器人》雜志上描述了他們的新架構(gòu)及其性能。

        深度神經(jīng)網(wǎng)絡(luò)能夠通過反復(fù)訓練多個示例來學習函數(shù)。迄今為止,它們已被廣泛用于各種應(yīng)用中,例如識別人群中的面孔或確定貸款申請人是否信譽良好。在這項新工作中,研究人員將針對不同應(yīng)用開發(fā)的幾種DNN組合在一起,以創(chuàng)建一個具有所有DNN組成部分優(yōu)勢的新系統(tǒng)。他們報告說,最終的系統(tǒng)不僅僅是其各個部分的總和,而且還能夠?qū)W習DNN不能單獨工作的新功能。研究人員稱其為多專家學習架構(gòu)(MELA)。

        更具體地說,這項工作涉及為不同功能培訓多個DNN。例如,有人學會了使機器人小跑。另一個可以繞過障礙物。然后,所有DNN都連接到門控神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)會隨著時間的流逝學習如何在需要控制其在環(huán)境中移動的機器人時需要其特殊技能的其他DNN。這樣,最終的系統(tǒng)便能夠執(zhí)行所有組合DNN的所有技能。

        但是,這還不是練習的終點,因為MELA了解了更多有關(guān)其組成部分及其功能的知識,它學會了通過嘗試和錯誤的方式將它們一起使用,而這是沒有教過的。例如,它學會了如何結(jié)合跌倒后的起床和處理濕滑的地板,或者學會如何在其中一個電機發(fā)生故障時進行處理。研究人員認為,他們的工作標志著機器人技術(shù)研究的一個新的里程碑,提供了一種新的范例,當機器人遇到以前從未遇到過的問題時,人們不必干預(yù)。