您現(xiàn)在的位置是:首頁 >要聞 > 2020-11-30 16:22:50 來源:
自然語言生成的認知狀態(tài)統(tǒng)計模型
為了使機器人能夠使用各種各樣的設置,它們需要能夠與人類進行無縫通信。因此,近年來,研究人員一直在開發(fā)越來越先進的計算模型,該模型可以使機器人處理人類語言并制定適當?shù)捻憫?/p>
機器應掌握的人類語言的一個重要方面是在句子中使用代詞。根據(jù)一種被稱為“ Givenness Hierarchy”(GH)的語言理論,人類根據(jù)對對象在聽眾心中的“認知狀態(tài)”的隱含假設,選擇要使用的代詞。例如,如果講話者假設他們的目標對象在當前對話中處于“焦點對準”(這是一種認知狀態(tài)),則他們可以選擇使用代詞“它”。
科羅拉多礦業(yè)大學MIRRORLab的研究人員最近在arXiv上預先發(fā)表的一篇論文中提出了兩種認知狀態(tài)模型。第一個模型是直接從GH文獻中得知的基于理論規(guī)則的有限狀態(tài)機模型,而第二個模型是預測不確定性下對象的認知狀態(tài)的統(tǒng)計概率模型(認知狀態(tài)過濾器)。
“我的顧問Tom Williams博士和他的同伴已經(jīng)開始使用認知狀態(tài)的概念來幫助機器人自然語言理解(NLU),在這種情況下,聽眾必須根據(jù)目標的認知狀態(tài)/引用形式信息來識別目標對象”,進行這項研究的研究人員之一Poulomi Pal告訴TechXplore。“我們最近論文的主要思想/目的是基于紀律層次結(jié)構(GH)的語言理論創(chuàng)建用于認知狀態(tài)過濾的計算模型,以達到自然語言生成(NLG)的目的,更具體地說,是提高機器的使用率代詞(例如,它,這個,那個等)。”
Pal和她的同事們提出的第一個模型是有限狀態(tài)機(FSM)模型,該模型根據(jù)GH文獻列出的規(guī)則生成物體的認知狀態(tài)。本文介紹的第二個模型是認知狀態(tài)過濾器(CSF),它可以從文本數(shù)據(jù)中自動學習這些規(guī)則。然后,研究人員根據(jù)通過在線Amazon Mechanical Turk平臺收集的數(shù)據(jù)訓練和評估了他們的CSF模型。
在他們的CSF模型的實驗設計過程中,研究人員使用了OFAI多模式任務描述語料庫的銀標準英語翻譯的子集,該庫是人與人,人與機器人多模式交互作用的集合。他們發(fā)現(xiàn)CSF處理不確定性要比FSM模型更好,因為CSF不遵循預先建立的規(guī)則,而是直接從所分析的數(shù)據(jù)中獲取規(guī)則。
帕爾說:“我們的結(jié)果表明,腦脊液模型在預測物體認知狀態(tài)方面的準確性比理論上的FSM模型稍好。” “與基于規(guī)則的理論模型相比,CSF模型在嘗試評估對象的認知狀態(tài)時(尤其是在數(shù)據(jù)較大時)可能是更可取的,因為它可以自動從數(shù)據(jù)中學習規(guī)則。”
帕爾和她的同事設計的CSF模型最終可以通過提高人與機器人在對話中使用代詞的能力來最終幫助增強人與機器人之間的自然語言互動。將來,這些發(fā)現(xiàn)可能會激發(fā)其他團隊開發(fā)類似的機器人應用模型,以及基于其他研究領域的類似技術,例如計算語言學或認知心理學。
帕爾說:“我們相信,開發(fā)像CSF這樣的計算模型將有助于促進認知知識的方法對自然語言的產(chǎn)生和理解的發(fā)展。” “我的進一步研究計劃包括開發(fā)和實施GH信息回指生成模型,該模型考慮了在選擇NLG的不同引用形式時利用CSF模型對物體的認知狀態(tài)。”