日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

<blockquote id="utafg"><th id="utafg"></th></blockquote>

<div id="utafg"></div>

<blockquote id="utafg"><th id="utafg"></th></blockquote>

<menuitem id="utafg"></menuitem>

<button id="ppowv"><ruby id="ppowv"></ruby></button><button id="ppowv"></button><rp id="ppowv"><pre id="ppowv"><pre id="ppowv"></pre></pre></rp>

您現(xiàn)在的位置是：首頁 >市場 > 2020-11-20 16:45:28 來源：

生成手勢以伴隨虛擬座席語音的模型

導讀虛擬助手和機器人正變得越來越復雜，具有交互性并且類似于人。但是，要完全復制人類的交流，人工智能(AI)代理不僅應該能夠確定用戶在說什么

虛擬助手和機器人正變得越來越復雜，具有交互性并且類似于人。但是，要完全復制人類的交流，人工智能(AI)代理不僅應該能夠確定用戶在說什么并產(chǎn)生適當?shù)捻憫€應該模仿他們的說話方式。

卡內(nèi)基梅隆大學(CMU)的研究人員最近進行了一項研究，旨在通過產(chǎn)生自然手勢來伴隨他們的語音來改善虛擬助手和機器人與人之間的通信方式。他們的論文預先發(fā)表在arXiv上并準備在2020年歐洲計算機視覺會議(ECCV)上發(fā)表，介紹了Mix-StAGE，這是一種新模型，可以產(chǎn)生不同風格的共語音手勢，最適合與之對應的語音。演講者和他/她在說什么。

進行這項研究的研究人員之一Chaitanya Ahuja對TechXplore說：“想象一下您正在通過虛擬現(xiàn)實耳機在虛擬空間中與朋友交流的情況。” “耳機只能聽到您的聲音，而看不到您的手勢。我們模型的目標是預測伴隨語音的手勢。”

當人們與他人交流時，他們通常會有獨特的手勢方式。Ahuja和他的同事們希望創(chuàng)建一個可將這些個體差異考慮在內(nèi)的共語音手勢生成模型，以產(chǎn)生與說話人的聲音和個性相一致的手勢。

Ahuja說：“ Mix-StAGE背后的關(guān)鍵思想是為許多不同樣式的手勢學習一個通用的手勢空間。” “此手勢空間包含所有可能的手勢，這些手勢按樣式分組。Mix-StAGE的后半部分學習如何在與輸入語音信號同步的同時預測任何給定樣式的手勢，這一過程稱為樣式轉(zhuǎn)移。”

Mix-StAGE受過訓練，可以為多個說話者產(chǎn)生有效的手勢，學習每個說話者的獨特風格特征，并產(chǎn)生與這些特征匹配的手勢。另外，該模型可以為另一位演講者的語音生成一個演講者風格的手勢。例如，它可以生成與說話者A所講的手勢相符的手勢，而手勢通常由說話者B使用。

Ahuja解釋說：“與以前的方法要求每種樣式都需要一個單獨的模型不同，我們能夠教一個單一的模型(即涉及較少的內(nèi)存)來代表許多手勢樣式。” “我們的模型利用手勢樣式之間的相似性，同時記住每個人(即每種樣式)的獨特之處。”

在最初的測試中，由Ahuja和他的同事開發(fā)的模型表現(xiàn)出色，可以產(chǎn)生不同樣式的逼真的有效手勢。此外，研究人員發(fā)現(xiàn)，隨著他們增加用于訓練Mix-StAGE的揚聲器的數(shù)量，其手勢生成準確性大大提高。將來，該模型可以幫助增強虛擬助手和機器人與人類進行交流的方式。

為了訓練Mix-StAGE，研究人員編輯了一個名為Pose-Audio-Transcript-Style(PATS)的數(shù)據(jù)集，其中包含25個說話的人的語音記錄，總計250個小時以上，并且手勢匹配。該數(shù)據(jù)集很快將被其他研究團隊用于訓練其他手勢生成模型。

“在我們目前的研究中，當生成手勢時，我們專注于語音的非語言部分(例如，韻律)，” Ahuja說。“我們?yōu)橄乱徊礁械脚d奮，我們還將語音的言語部分(即語言)作為另一種輸入。假設(shè)是語言將有助于特定類型的手勢，例如圖標或隱喻手勢，其中說話的意思可能是最重要的。”

免責聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！

標簽：虛擬座席語音

上一篇:云計算測試平臺Chameleon專注于物聯(lián)網(wǎng)和可重復性

下一篇:新的超分辨率方法無需不斷放大即可顯示出精美的細節(jié)

猜你喜歡

華為MateBook數(shù)字系列新品強勢登場

國際零售業(yè)務會關(guān)注新的區(qū)域市場機會

阿里云將徹底分拆

戴珊稱將不斷降低商家經(jīng)營成本

華為發(fā)布WATCH4系列手表

星巴克在2008年第一次裁員

星巴克創(chuàng)始人說自己犯了個巨大的錯誤

Grab第一季度營收5點25億美元

Vidda投影新品三連發(fā)

阿里高管解讀Q4財報

華為發(fā)布全屋智能4點0

兩度暫停之后幣安恢復比特幣提取

代練通代打未達要求仲裁不公正

阿里云宣布推出金融級云原生

小度科技將進軍手機市場

權(quán)重大金融搭臺行情等待題材股唱戲

最新文章

定安縣文物志（關(guān)于定安縣文物志介紹）

建筑家龍慶忠（關(guān)于建筑家龍慶忠介紹）

排鉛食品（關(guān)于排鉛食品簡介）

崇陽眼子菜（關(guān)于崇陽眼子菜簡介）

怎樣畫蘭竹石（關(guān)于怎樣畫蘭竹石介紹）

愛給了你我不后悔是什么歌（愛給了你我不后悔歌曲介紹）

建筑家陳伯齊（關(guān)于建筑家陳伯齊介紹）

定安縣扶貧工作辦公室（關(guān)于定安縣扶貧工作辦公室介紹）

崇陽源清水務有限公司（關(guān)于崇陽源清水務有限公司簡介）

排鉛藥物（關(guān)于排鉛藥物簡介）

清華大學在哪個城市（清華大學簡介）

鞠萍的個人資料簡介（鞠萍的個人簡介）

排鉛口服液（關(guān)于排鉛口服液簡介）

怎樣畫蘭（關(guān)于怎樣畫蘭介紹）

建筑家林克明（關(guān)于建筑家林克明介紹）

崇陽浪口森林溫泉（關(guān)于崇陽浪口森林溫泉簡介）

點擊排行

熱門推薦

隨機推薦

<track id="vmzgx"></track>