您現(xiàn)在的位置是:首頁(yè) >生活 > 2021-04-22 17:32:36 來源:
微軟稱其語(yǔ)音識(shí)別現(xiàn)在與人類相當(dāng)
研究人員今天宣布,微軟的訓(xùn)練神經(jīng)網(wǎng)絡(luò)現(xiàn)在擅長(zhǎng)識(shí)別人類的聲音。
在周一發(fā)布的一份報(bào)告中,研究人員將微軟的NIST 2000自動(dòng)化系統(tǒng)與專業(yè)轉(zhuǎn)錄員進(jìn)行了對(duì)比,并首次發(fā)現(xiàn)人類的錯(cuò)誤率高于計(jì)算機(jī)。
周一發(fā)布的報(bào)告稱,“這標(biāo)志著人們首次報(bào)道人類平價(jià)會(huì)話。”
更好的語(yǔ)音識(shí)別可能會(huì)影響未來的一系列Microsoft產(chǎn)品。
“里程碑將對(duì)消費(fèi)者和商業(yè)產(chǎn)品產(chǎn)生廣泛影響,可以通過語(yǔ)音識(shí)別顯著增強(qiáng)。其中包括消費(fèi)娛樂設(shè)備,如Xbox,可訪問性工具,如即時(shí)語(yǔ)音到文本轉(zhuǎn)錄,以及個(gè)人數(shù)字助理,如Cortana,“微軟在今天發(fā)表的關(guān)于這項(xiàng)成就的博客文章中說。
微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)宣稱,對(duì)話將像圖形用戶界面 (GUI)一樣對(duì)計(jì)算產(chǎn)生影響,并且對(duì)話將在不久的將來進(jìn)入所有計(jì)算領(lǐng)域。
最近在數(shù)十年來對(duì)人類聲音的計(jì)算機(jī)識(shí)別的追求中取得了其他進(jìn)步。
今年早些時(shí)候,百度研究中心與華盛頓大學(xué)和斯坦福大學(xué)合作,宣布百度程序Deep Speech 2能夠以比人類用手指打字快三倍的速度轉(zhuǎn)錄語(yǔ)音 。
會(huì)話語(yǔ)音識(shí)別領(lǐng)域的許多早期進(jìn)步來自DARPA,自20世紀(jì)70年代以來,國(guó)防部的研究部門一直活躍于語(yǔ)音識(shí)別研究領(lǐng)域。
上一篇:如果要相信這個(gè)Moto Z4泄漏Moto Mods還沒有死
下一篇:可能被稱為Pixel 3a和Pixel 3a XL的更便宜的Google Pixel手機(jī)可能會(huì)配備Snapdragon 670