您現(xiàn)在的位置是:首頁 >互聯(lián)網(wǎng) > 2020-11-06 11:37:09 來源:
Salesforce在自然語言處理方面取得了重大進(jìn)展
就在幾年前,問電話一個(gè)問題來在Internet上查找信息幾乎是不可能的,因?yàn)橛?jì)算機(jī)并不能很好地理解少數(shù)幾個(gè)短語。
現(xiàn)在,由于機(jī)器學(xué)習(xí)的進(jìn)步,我們認(rèn)為Google或Siri都無法很好地回答我們的查詢。但是,這一進(jìn)展是艱苦的,需要對(duì)非常具體的自然語言處理任務(wù)進(jìn)行深入的培訓(xùn),例如將文本翻譯成語音,分析情感或理解代詞引用。
這就是Salesforce.com Inc.研究人員認(rèn)為他們已經(jīng)開始解決的問題。今天,他們發(fā)布了一篇論文,概述了一種使用單一模型的方法,該模型可以一次處理10個(gè)單獨(dú)的NLP任務(wù)。該論文本質(zhì)上是一個(gè)挑戰(zhàn),簡(jiǎn)稱自然語言十項(xiàng)全能(decathlon)或decaNLP,與“多任務(wù)問題回答網(wǎng)絡(luò)”或MQAN模型結(jié)合使用,可以同時(shí)學(xué)習(xí)所有10個(gè)任務(wù)。
Salesforce首席科學(xué)家Richard Socher(如圖)在采訪中說:“我們的模型就像NLP的瑞士軍刀。” 換句話說,研究人員和開發(fā)人員實(shí)質(zhì)上可以使用一種工具,而不必為每個(gè)任務(wù)都使用一個(gè)工具,因?yàn)檫@些工具需要超定制化模型,而該模型無法用于任何其他任務(wù)。
最終,結(jié)果可能是功能更強(qiáng)大的聊天機(jī)器人,例如,可以更自然地與人交談。
索赫(Socher)類似于ImageNet,這是他幫助開發(fā)的帶標(biāo)簽圖像數(shù)據(jù)庫,被廣泛認(rèn)為是引發(fā)了深度學(xué)習(xí)的革命,該革命導(dǎo)致了圖像識(shí)別方面的突破。 但是,沒有一項(xiàng)任務(wù)可以類似地定義自然語言處理,其中包括諸如機(jī)器翻譯,自然語言推理,面向目標(biāo)的對(duì)話和代詞解析之類的事情。Socher說:“在NLP中,實(shí)際上并沒有一個(gè)單一的任務(wù),所有研究人員都認(rèn)為,如果您在此方面取得進(jìn)展,它將整體上改善NLP。”
Salesforce研究人員(包括Bryan McCann,Nitish Shirish Keskar和Caiming Xiong)的方法是將這些任務(wù)中的每一個(gè)都作為問題解答。Socher解釋說:“問題的答案是如此廣泛-您可以問任何問題-它使您可以用一個(gè)模型來完成多個(gè)任務(wù)。”
MQAN允許進(jìn)行所謂的“零鏡頭”學(xué)習(xí),這意味著該模型可以處理以前從未見過的或經(jīng)過培訓(xùn)可以完成的任務(wù)。麥肯說:“您正在將它應(yīng)用于一項(xiàng)全新的任務(wù),這是以前從未完成的。” “大多數(shù)模型對(duì)措辭或含義的細(xì)微變化都不夠魯棒。是我們的。即使從未見過這樣的事情,它也可以做到。”他補(bǔ)充說,要使它扎根于世,聊天機(jī)器人可以使用并非完全已經(jīng)學(xué)到的短語來做得更好,更像是人們?nèi)绾谓涣鳌?/p>
McCann說,Salesforce正在開放該模型的采購,因此“人們可以在我們離開的地方接貨。”
Salesforce提供了來自著名AI研究人員Yoshua Bengio的觀點(diǎn),該研究人員是蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)籌學(xué)系教授,他曾與Socher在緊密的機(jī)器學(xué)習(xí)社區(qū)中合作。
他說:“自從大約二十年前我開始從事代表自然語言的詞嵌入工作以來,我的目標(biāo)是所有自然語言任務(wù)都應(yīng)使用相同的表現(xiàn)形式。” “本文中將所有這些任務(wù)都表示為問題解答的想法至關(guān)重要,但這還不夠。作者提出了十項(xiàng)自然語言十項(xiàng)全能法,以定義該目標(biāo)的基準(zhǔn),并介紹了建筑創(chuàng)新,最終使這一夢(mèng)想成為可能。”