日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

<blockquote id="utafg"><th id="utafg"></th></blockquote>

<div id="utafg"></div>

<blockquote id="utafg"><th id="utafg"></th></blockquote>

<menuitem id="utafg"></menuitem>

您現(xiàn)在的位置是：首頁(yè) >市場(chǎng) > 2020-11-19 09:42:35 來(lái)源：

深度學(xué)習(xí)模型在Gran上實(shí)現(xiàn)了超人的表現(xiàn)

導(dǎo)讀在過(guò)去的幾十年中，全球的研究團(tuán)隊(duì)開(kāi)發(fā)了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)，這些技術(shù)可以在各種任務(wù)上實(shí)現(xiàn)人類(lèi)可比的性能。這些模型中的一些還經(jīng)過(guò)訓(xùn)

在過(guò)去的幾十年中，全球的研究團(tuán)隊(duì)開(kāi)發(fā)了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)，這些技術(shù)可以在各種任務(wù)上實(shí)現(xiàn)人類(lèi)可比的性能。這些模型中的一些還經(jīng)過(guò)訓(xùn)練，可以玩著名的棋盤(pán)或視頻游戲，例如古代中國(guó)游戲Go或Atari街機(jī)游戲，以便進(jìn)一步評(píng)估其功能和性能。

蘇黎世大學(xué)和索尼AI蘇黎世大學(xué)的研究人員最近測(cè)試了一種基于深度強(qiáng)化學(xué)習(xí)的方法的性能，該方法經(jīng)過(guò)訓(xùn)練可玩Gran Turismo Sport，這是由Polyphony Digital開(kāi)發(fā)并由Sony Interactive Entertainment發(fā)行的著名賽車(chē)視頻游戲。他們的發(fā)現(xiàn)發(fā)表在arXiv上預(yù)先發(fā)表的一篇論文中，進(jìn)一步凸顯了深度學(xué)習(xí)技術(shù)在模擬環(huán)境中控制汽車(chē)的潛力。

進(jìn)行這項(xiàng)研究的研究人員之一宋云龍告訴TechXplore：“高速自動(dòng)駕駛是一項(xiàng)艱巨的任務(wù)，即使車(chē)輛接近其物理極限，也需要做出快速而精確的動(dòng)作。” “自動(dòng)賽車(chē)的目標(biāo)是在最短的時(shí)間內(nèi)完成給定的路線，其中包括控制汽車(chē)以接近其物理限制的一些困難。要解決這些挑戰(zhàn)并推進(jìn)前沿，我們考慮了自動(dòng)賽車(chē)的任務(wù)在最暢銷(xiāo)的賽車(chē)游戲《 Gran Turismo Sport》中，該游戲以對(duì)各種汽車(chē)和賽道的詳細(xì)物理模擬而聞名。”

Song和他的同事最近進(jìn)行的研究的主要目的是開(kāi)發(fā)一種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的控制器，該控制器可以在模擬軌道內(nèi)自動(dòng)移動(dòng)賽車(chē)，而無(wú)需事先了解賽車(chē)的動(dòng)力學(xué)特性。為了在Gran Turismo Sport上表現(xiàn)出色，控制器應(yīng)嘗試盡量減少完成給定軌道的時(shí)間。

為了實(shí)現(xiàn)他們的目標(biāo)，研究人員首先定義了一個(gè)獎(jiǎng)勵(lì)函數(shù)，該函數(shù)將“競(jìng)賽問(wèn)題”公式化為最短時(shí)間問(wèn)題，并概述了將輸入的觀察結(jié)果直接映射到汽車(chē)控制命令的神經(jīng)網(wǎng)絡(luò)策略。隨后，他們使用強(qiáng)化學(xué)習(xí)訓(xùn)練了神經(jīng)網(wǎng)絡(luò)的參數(shù)，從而最大限度地提高了模型在表現(xiàn)良好時(shí)將獲得的回報(bào)。

研究人員在Gran Turismo Sport的試驗(yàn)中訓(xùn)練了他們基于神經(jīng)網(wǎng)絡(luò)的控制器，并在四個(gè)Playstation 4游戲機(jī)和臺(tái)式PC上運(yùn)行了該游戲。值得注意的是，經(jīng)過(guò)不到73小時(shí)的訓(xùn)練，他們的模型已經(jīng)達(dá)到了超人的表現(xiàn)。

免責(zé)聲明：本文由用戶(hù)上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

標(biāo)簽：深度學(xué)習(xí)

上一篇:Note95G的首次亮相非常接近了

下一篇:新算法可以使自動(dòng)駕駛汽車(chē)更安全嗎

猜你喜歡

華為MateBook數(shù)字系列新品強(qiáng)勢(shì)登場(chǎng)

國(guó)際零售業(yè)務(wù)會(huì)關(guān)注新的區(qū)域市場(chǎng)機(jī)會(huì)

阿里云將徹底分拆

戴珊稱(chēng)將不斷降低商家經(jīng)營(yíng)成本

華為發(fā)布WATCH4系列手表

星巴克在2008年第一次裁員

星巴克創(chuàng)始人說(shuō)自己犯了個(gè)巨大的錯(cuò)誤

Grab第一季度營(yíng)收5點(diǎn)25億美元

Vidda投影新品三連發(fā)

阿里高管解讀Q4財(cái)報(bào)

華為發(fā)布全屋智能4點(diǎn)0

兩度暫停之后幣安恢復(fù)比特幣提取

代練通代打未達(dá)要求仲裁不公正

阿里云宣布推出金融級(jí)云原生

小度科技將進(jìn)軍手機(jī)市場(chǎng)

權(quán)重大金融搭臺(tái)行情等待題材股唱戲

最新文章

定安縣文物志（關(guān)于定安縣文物志介紹）

建筑家龍慶忠（關(guān)于建筑家龍慶忠介紹）

排鉛食品（關(guān)于排鉛食品簡(jiǎn)介）

崇陽(yáng)眼子菜（關(guān)于崇陽(yáng)眼子菜簡(jiǎn)介）

怎樣畫(huà)蘭竹石（關(guān)于怎樣畫(huà)蘭竹石介紹）

愛(ài)給了你我不后悔是什么歌（愛(ài)給了你我不后悔歌曲介紹）

建筑家陳伯齊（關(guān)于建筑家陳伯齊介紹）

定安縣扶貧工作辦公室（關(guān)于定安縣扶貧工作辦公室介紹）

崇陽(yáng)源清水務(wù)有限公司（關(guān)于崇陽(yáng)源清水務(wù)有限公司簡(jiǎn)介）

排鉛藥物（關(guān)于排鉛藥物簡(jiǎn)介）

清華大學(xué)在哪個(gè)城市（清華大學(xué)簡(jiǎn)介）

鞠萍的個(gè)人資料簡(jiǎn)介（鞠萍的個(gè)人簡(jiǎn)介）

排鉛口服液（關(guān)于排鉛口服液簡(jiǎn)介）

怎樣畫(huà)蘭（關(guān)于怎樣畫(huà)蘭介紹）

建筑家林克明（關(guān)于建筑家林克明介紹）

崇陽(yáng)浪口森林溫泉（關(guān)于崇陽(yáng)浪口森林溫泉簡(jiǎn)介）

點(diǎn)擊排行

熱門(mén)推薦

隨機(jī)推薦