日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >財經(jīng) > 2021-04-25 19:17:26 來源:

        Google開源人工智能可以區(qū)分語音準(zhǔn)確率達(dá)92%

        導(dǎo)讀 Diarization - 將語音樣本劃分為獨特的同類片段的過程,根據(jù)誰說什么,何時 - 對機(jī)器來說不像人類那樣容易,并且訓(xùn)練機(jī)器學(xué)習(xí)算法來執(zhí)

        Diarization - 將語音樣本劃分為獨特的同類片段的過程,根據(jù)誰說什么,何時 - 對機(jī)器來說不像人類那樣容易,并且訓(xùn)練機(jī)器學(xué)習(xí)算法來執(zhí)行它比使用它更難聲音。強(qiáng)大的二值化系統(tǒng)必須能夠?qū)⑿聜€體與之前未遇到的語音段相關(guān)聯(lián)。

        Google開源人工智能可以區(qū)分語音準(zhǔn)確率達(dá)92%

        但谷歌的人工智能研究部門已經(jīng)朝著高性能模式取得了令人鼓舞的進(jìn)展。在一篇新論文(“ 全監(jiān)督演講者Diarization ”)和隨附的博客文章中,研究人員描述了一種新的人工智能(AI)系統(tǒng),該系統(tǒng)“以更有效的方式利用受監(jiān)督的揚聲器標(biāo)簽”。

        該論文的作者聲稱核心算法實現(xiàn)了對于實時應(yīng)用程序而言足夠低的在線分類錯誤率(DER) - 在NIST SRE 2000 CALLHOME基準(zhǔn)測試中為7.6%%,而谷歌之前的方法為8.8%%DER - 可在開放時使用Github上的源代碼。

        谷歌研究人員的新方法通過遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模擬說話者的嵌入(即,單詞和短語的數(shù)學(xué)表示),RNN是一種機(jī)器學(xué)習(xí)模型,可以使用其內(nèi)部狀態(tài)來處理輸入序列。每個發(fā)言者都以自己的RNN實例開始,該實例在給定新嵌入的情況下不斷更新RNN狀態(tài),使系統(tǒng)能夠?qū)W習(xí)在發(fā)言者和話語之間共享的高級知識。

        “由于該系統(tǒng)的所有組件都可以以監(jiān)督的方式學(xué)習(xí),因此在可以獲得帶有高質(zhì)量時間標(biāo)記的揚聲器標(biāo)簽的訓(xùn)練數(shù)據(jù)的情況下,它優(yōu)于無監(jiān)督系統(tǒng),”研究人員在論文中寫道。“我們的系統(tǒng)受到全面監(jiān)督,并且能夠從帶有時間標(biāo)記的揚聲器標(biāo)簽的示例中學(xué)習(xí)。”

        在未來的工作中,團(tuán)隊計劃優(yōu)化模型,以便它可以集成上下文信息以執(zhí)行離線解碼,他們期望這將進(jìn)一步減少DER。他們還希望直接對聲學(xué)特征進(jìn)行建模,以便整個揚聲器系統(tǒng)可以進(jìn)行端到端的訓(xùn)練。