日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >綜合 > 2020-12-11 09:05:14 來源:

        Facebook研究人員使用數(shù)學(xué)來獲得更好的翻譯

        導(dǎo)讀 機(jī)器翻譯工具的設(shè)計人員仍然大多依靠字典來使外語易于理解。但是現(xiàn)在有了一種新方法:數(shù)字。Facebook研究人員說,將單詞變成數(shù)字并利用語言

        機(jī)器翻譯工具的設(shè)計人員仍然大多依靠字典來使外語易于理解。但是現(xiàn)在有了一種新方法:數(shù)字。Facebook研究人員說,將單詞變成數(shù)字并利用語言之間的數(shù)學(xué)相似性是一個有前途的途徑-即使“星際迷航”這樣的通用傳播者仍然遙遙無期。

        強(qiáng)大的自動翻譯是互聯(lián)網(wǎng)巨頭的首要任務(wù)。在世界范圍內(nèi)允許盡可能多的人交流不僅是無私的目標(biāo),而且還是一項好生意。

        Facebook,Google和Microsoft以及俄羅斯的Yandex,中國的Baidu等都在不斷尋求改善其翻譯工具的方法。

        Facebook在巴黎的一個研究實驗室中聘用了人工智能專家。

        歐洲社交網(wǎng)絡(luò)基礎(chǔ)AI研究的共同負(fù)責(zé)人Antoine Bordes說,F(xiàn)acebook目前使用多達(dá)200種語言。

        當(dāng)前,自動翻譯基于具有兩種語言的相同文本的大型數(shù)據(jù)庫來工作。但是對于許多語言對來說,這樣的平行文本還遠(yuǎn)遠(yuǎn)不夠。

        這就是為什么研究人員一直在尋找另一種方法的原因,例如Facebook開發(fā)的系統(tǒng)可以創(chuàng)建單詞的數(shù)學(xué)表示形式。

        每個單詞在幾百個維度的空間中成為一個“向量”。在該向量空間中,口語中具有緊密關(guān)聯(lián)的單詞也會發(fā)現(xiàn)自己彼此接近。

        從巴斯克到亞馬孫?

        該系統(tǒng)之一的Guillaume Lample說:“例如,如果您在語義上使用'cat'和'dog'一詞,它們是描述相似事物的詞,因此它們在物理上會非常接近。”設(shè)計師。

        “如果您使用馬德里,倫敦,巴黎等歐洲首都之類的話,那就是同一主意。”

        然后可以使用算法將這些語言映射相互鏈接-最初是粗略的,但最終會變得更加精致,直到可以匹配整個短語而沒有太多錯誤為止。

        蘭普爾說,結(jié)果已經(jīng)很有希望。

        蘭普爾說,對于英語-羅馬尼亞語的一對語言來說,F(xiàn)acebook當(dāng)前的機(jī)器翻譯系統(tǒng)比詞向量系統(tǒng)“相等或可能更差”。

        他說,但對于Facebook-傳統(tǒng)系統(tǒng)沒有很多雙語文本可供參考的英語-烏爾都語稀疏語言對來說,單詞矢量系統(tǒng)已經(jīng)很出色了。

        但是該方法是否可以將巴斯克語翻譯成亞馬遜部落的語言?

        蘭普爾說,從理論上講,是的,但實際上,要映射該語言,需要大量書面文本,這是亞馬遜部落語言所缺乏的。

        他說:“如果你只有成千上萬個短語,那將是行不通的。你需要成千上萬個短語。”