您現(xiàn)在的位置是:首頁(yè) >綜合 > 2021-04-25 21:35:36 來(lái)源:
亞馬遜的研究人員提高了Alexa理解復(fù)雜命令的能力
亞馬遜的Alexa在一次性理解多步驟請(qǐng)求方面變得越來(lái)越精通。在一篇論文(“口語(yǔ)協(xié)調(diào)的解析協(xié)調(diào)”)和今天早上發(fā)表的隨附博客文章中,Alexa AI組織的應(yīng)用科學(xué)家Sanchit Agarwal詳細(xì)介紹了一種將語(yǔ)音命令映射到行為的口語(yǔ)理解(SLU)系統(tǒng)(意圖)和實(shí)體(插槽)比現(xiàn)成的替代品準(zhǔn)確度高26%%。
Agarwal及其同事的工作將在本月晚些時(shí)候在希臘雅典舉行的IEEE口語(yǔ)技術(shù)會(huì)議上展出。亞馬遜科學(xué)家描述了一種可以將Alexa的技能選擇錯(cuò)誤率降低40%%的AI驅(qū)動(dòng)方法,這一天他們的研究消息傳來(lái)。
“狹義[SLU系統(tǒng)]通常有嚴(yán)格的約束,例如只允許一個(gè)意圖與話語(yǔ)相關(guān)聯(lián),只有一個(gè)值與一個(gè)插槽類型相關(guān)聯(lián),”他寫道。“我們[建議]一種方法,使SLU系統(tǒng)能夠理解復(fù)合實(shí)體和意圖。”
正如Agarwal解釋的那樣,他和同事們使用了一個(gè)深層神經(jīng)網(wǎng)絡(luò) - 稱為神經(jīng)元的數(shù)學(xué)函數(shù)層,它們的生物學(xué)等價(jià)物是松散的模型 - 從口語(yǔ)數(shù)據(jù)的結(jié)構(gòu)中“教導(dǎo)”。首先,根據(jù)指示應(yīng)被視為集合的詞組或“塊”的方案來(lái)標(biāo)記語(yǔ)料庫(kù):“B”表示塊的開(kāi)頭,“I”表示塊的內(nèi)部,或者“O”表示位于大塊之外的單詞。然后,在訓(xùn)練之前,單詞進(jìn)行嵌入,這個(gè)過(guò)程涉及用向量代替它們來(lái)代表它們。
接下來(lái)將嵌入傳遞給雙向長(zhǎng)短期記憶(bi-LSTM)網(wǎng)絡(luò),這是一種能夠?qū)W習(xí)長(zhǎng)期依賴性的遞歸神經(jīng)網(wǎng)絡(luò),其輸出輸入句子中每個(gè)單詞的上下文嵌入。這些輸出與神經(jīng)網(wǎng)絡(luò)層相結(jié)合,神經(jīng)網(wǎng)絡(luò)層將每個(gè)嵌入映射到輸出“B”,“I”和“O”標(biāo)簽上的分布,根據(jù)其最可能的輸出標(biāo)簽對(duì)輸入的每個(gè)字進(jìn)行分類。
另一個(gè)層(稱為條件隨機(jī)字段或CRF)學(xué)會(huì)了在輸出標(biāo)簽之間進(jìn)行關(guān)聯(lián),并從所有可能的序列中選擇最可能的標(biāo)簽。感謝一種稱為對(duì)抗性訓(xùn)練的技術(shù) - 在此期間,網(wǎng)絡(luò)被評(píng)估其預(yù)測(cè)標(biāo)簽的好壞程度 - 該模型學(xué)會(huì)了概括。
“我們不是為不同的插槽類型(例如ListItem,F(xiàn)oodItem,Appliance等)構(gòu)建單獨(dú)的解析器,而是構(gòu)建了一個(gè)可以處理多種插槽類型的解析器,”Agarwal說(shuō)。“例如,我們的解析器可以成功識(shí)別話語(yǔ)中的[列表項(xiàng)目]'將蘋果花生醬和果凍添加到我的列表中'和[電器]在話語(yǔ)'打開(kāi)客廳燈和廚房燈'。