您現(xiàn)在的位置是:首頁 >動態(tài) > 2020-07-01 17:05:33 來源:
語音助手對非本地口音和語言的理解很差
在預(yù)印服務(wù)器Arxiv.org上發(fā)表的一篇論文中,都柏林大學(xué)的研究人員調(diào)查了非本地英語用戶與本地用戶相比如何體驗語音助手(特別是Google助手)。通過確定在整個實驗過程中使用的兩組說話者之間命令之間的語義和風(fēng)格差異,合著者說,他們的工作表明擴大研究人員范圍的重要性,以確保在設(shè)計助手時考慮到包容性。
越來越多的研究表明,包括Siri,Alexa和Google Assistant在內(nèi)的語音助手對非本地口音和語言的理解很差。一個華盛頓郵報-commissioned研究發(fā)表在2018年7月發(fā)現(xiàn),誰講西班牙語作為第一語言的人都理解6%,通常少于英語母語誰各地加利福尼亞州或華盛頓長大。最近,在一個測試通過語音識別測試實驗室進行發(fā)聲,Siri的和Alexa都無法理解揚聲器中國口音的時間22%。
都柏林的研究人員通過電子郵件從歐洲大學(xué)招募了32名參與者,其中16名以英語為母語的人,其余16名以普通話為母語的人。兩個小組都被要求完成12個任務(wù),包括播放音樂,設(shè)置鬧鐘,轉(zhuǎn)換值,在特定位置詢問時間,控制設(shè)備音量以及使用智能手機和智能揚聲器通過Google Assistant請求天氣信息。與這兩種設(shè)備進行交互之后,受試者參加了一次訪談,重點是對語音助手的一般看法,在實驗中使用語音助手的經(jīng)驗以及對他們?nèi)绾闻c每個系統(tǒng)交談的思考。
研究人員說,無論使用哪種設(shè)備,使用Google Assistant時,母語使用者和非母語使用者的體驗都會出現(xiàn)“明顯差異”:
當(dāng)與助手進行互動時,以英語為母語的人優(yōu)先考慮聲音的清晰度,簡潔性和計劃性,而以非母語的人為基礎(chǔ),他們會根據(jù)自己是否知道某個特定單詞來更改詞匯。
非母語的人對其發(fā)音很敏感,或者在互動過程中需要檢索正確的單詞。他們經(jīng)常感到自己在努力喚醒Google Assistant。
非母語人士還建議他們有時需要額外的時間來表達句子,而助手沒有考慮到這一點,助手會在完成請求之前重新設(shè)置或插入。相比之下,母語為母語的人則認(rèn)為與助理交談和響應(yīng)之間的時間間隔太長,這使他們懷疑助理是否工作正常。
非母語人士說,基于屏幕的反饋對于支持他們的體驗非常重要。例如,發(fā)現(xiàn)智能手機屏幕上播放的語音識別轉(zhuǎn)錄可以幫助增強說話者對助手的識別能力的信心,同時還能指出助手不理解某些內(nèi)容的原因。
這些發(fā)現(xiàn)并不完全是令人震驚的-語音的語言差異多年來困擾著算法。(最近的一項研究發(fā)現(xiàn),使用蘇格蘭語的人對YouTube的自動字幕制作要比美國南方人語更為糟糕。)但是,這使諸如谷歌這樣的公司面臨的技術(shù)難題緩解了,這些公司已經(jīng)售出了數(shù)千萬個智能揚聲器,但這些技術(shù)難題尚待克服。
根據(jù)參與者的反應(yīng),研究人員得出結(jié)論,如果系統(tǒng)知道先前嘗試說出命令的聲音,語音助手可能會為非母語人士提供更好的體驗。研究人員說,在識別出命令的意圖但名詞不被識別的情況下,助手也可以提供上下文線索,或者使用啟動關(guān)鍵字和結(jié)構(gòu)來幫助用戶重新定義命令。
“我們的[結(jié)果]強調(diào)了……說話者與[助手]互動之間的一些重要區(qū)別。該研究的合著者寫道:[母語]的人強調(diào)簡潔和簡短的話語的重要性[而非母語的人似乎在很大程度上將潛在的互動失敗的負擔(dān)加在自己身上,因為他們的發(fā)音和缺乏語言知識是嚴(yán)重的障礙。“ 。“ [語音助手]的未來設(shè)計應(yīng)在系統(tǒng)將用戶識別為非母語使用者的情況下定制體驗,并應(yīng)更深入地探索定制體驗的方法。如果不進行這些更改,[非母語人士]可能會更容易放棄[助手]使用。”
谷歌發(fā)言人在一份聲明中告訴VentureBeat,該公司“致力于在這一領(lǐng)域取得進展”,并且它已經(jīng)開發(fā)了開源工具和數(shù)據(jù)集,以幫助識別和消除語音識別模型的偏見。發(fā)言人說:“公平是我們AI的核心原則之一……多年來,我們一直在努力準(zhǔn)確地識別語音變化,這一挑戰(zhàn)將繼續(xù)下去。”