日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >生活 > 2021-04-20 17:50:13 來源:

        Google和OpenAI的新工具讓我們更好地了解人工智能

        導(dǎo)讀 人工智能的世界是什么樣的?幾十年來,研究人員一直對(duì)此感到困惑,但近年來,這個(gè)問題變得更加緊迫。機(jī)器視覺系統(tǒng)正在越來越多的生活領(lǐng)域得

        人工智能的世界是什么樣的?幾十年來,研究人員一直對(duì)此感到困惑,但近年來,這個(gè)問題變得更加緊迫。機(jī)器視覺系統(tǒng)正在越來越多的生活領(lǐng)域得到應(yīng)用,從醫(yī)療保健到自動(dòng)駕駛汽車,但是通過機(jī)器的眼睛“看到” - 理解為什么它將那個(gè)人歸類為行人但將其作為路標(biāo) -仍然是一個(gè)挑戰(zhàn)。我們無法這樣做可能會(huì)產(chǎn)生嚴(yán)重甚至致命的后果。有人會(huì)說,由于涉及自動(dòng)駕駛汽車的死亡,它已經(jīng)有了。

        Google和OpenAI的新工具讓我們更好地了解人工智能

        谷歌和非營(yíng)利實(shí)驗(yàn)室OpenAI的新研究希望通過繪制這些系統(tǒng)用于理解世界的視覺數(shù)據(jù)來進(jìn)一步開放人工智能視覺的黑匣子。這種被稱為“ 激活地圖集 ”的方法讓研究人員可以分析各種算法的工作原理,不僅揭示了他們識(shí)別的抽象形狀,顏色和圖案,還揭示了他們?nèi)绾螌⑦@些元素結(jié)合起來識(shí)別特定的物體,動(dòng)物和場(chǎng)景。

        谷歌的Shan Carter是這項(xiàng)工作的首席研究員,他告訴The Verge,如果先前的研究就像在算法的視覺字母表中顯示單個(gè)字母一樣,激活地圖集提供了更接近整個(gè)字典的東西,顯示字母是如何組合在一起制作實(shí)際字詞的。“因此,在像'鯊魚'這樣的圖像類別中,會(huì)有很多激活因素,比如'牙齒'和'水',”卡特說。

        這項(xiàng)工作不一定是一個(gè)巨大的突破,但它在更廣泛的研究領(lǐng)域中向前邁出了一步,稱為“特征可視化”。佐治亞理工學(xué)院的博士生Ramprasaath Selvaraju沒有參與這項(xiàng)工作,他說這項(xiàng)研究“非常令人著迷的“并結(jié)合了許多現(xiàn)有的想法來創(chuàng)造一個(gè)新的”非常有用“的工具。

        Selvaraju告訴The Verge,在未來,這樣的工作將有很多用途,幫助我們建立更高效和先進(jìn)的算法,并通過讓研究人員進(jìn)入內(nèi)部來提高他們的安全性和消除偏見。“由于[神經(jīng)網(wǎng)絡(luò)]固有的復(fù)雜性,它們?nèi)狈山忉屝裕?rdquo;Selvaraju說。但他表示,未來,當(dāng)這種網(wǎng)絡(luò)經(jīng)常用于駕駛汽車和引導(dǎo)機(jī)器人時(shí),這將是必要的。

        OpenAI的Chris Olah也參與了這個(gè)項(xiàng)目,他說:“感覺有點(diǎn)像創(chuàng)造一個(gè)顯微鏡。至少,這就是我們所追求的目標(biāo)。“

        激活神經(jīng)元

        要了解激活地圖集和其他功能可視化工具的工作原理,首先需要了解一下AI系統(tǒng)如何識(shí)別對(duì)象。

        實(shí)現(xiàn)這一目標(biāo)的基本方法是使用神經(jīng)網(wǎng)絡(luò):一種與人類大腦大致相似的計(jì)算結(jié)構(gòu)(雖然它在復(fù)雜性方面落后了數(shù)年)。在每個(gè)神經(jīng)網(wǎng)絡(luò)內(nèi)部是像網(wǎng)狀物一樣連接的人造神經(jīng)元層。像大腦中的細(xì)胞一樣,這些細(xì)胞會(huì)響應(yīng)刺激,這一過程稱為激活。重要的是,它們不僅可以開啟或關(guān)閉; 它們?cè)诠庾V上注冊(cè),為每次激活賦予特定值或“重量”。

        要將神經(jīng)網(wǎng)絡(luò)變?yōu)橛杏玫臇|西,您必須提供大量的訓(xùn)練數(shù)據(jù)。在視覺算法的情況下,這將意味著數(shù)十萬甚至數(shù)百萬的圖像,每個(gè)圖像都標(biāo)記有特定的類別。在谷歌和OpenAI的研究人員為這項(xiàng)工作測(cè)試的神經(jīng)網(wǎng)絡(luò)的情況下,這些類別是廣泛的:從羊毛到溫莎的所有東西,從安全帶到太空加熱器。

        當(dāng)它提供這些數(shù)據(jù)時(shí),神經(jīng)網(wǎng)絡(luò)中的不同神經(jīng)元會(huì)響應(yīng)每個(gè)圖像而亮起。此模式連接到圖像的標(biāo)簽,這種關(guān)聯(lián)允許網(wǎng)絡(luò)“學(xué)習(xí)”事物的樣子。一旦經(jīng)過訓(xùn)練,您就可以向網(wǎng)絡(luò)顯示以前從未見過的圖片,并且神經(jīng)元將激活,將輸入與特定類別相匹配。恭喜!您剛剛訓(xùn)練了機(jī)器學(xué)習(xí)視覺算法。

        如果所有這些聽起來都令人不安,那就是因?yàn)?,在很多方面,它都是如此。像許多機(jī)器學(xué)習(xí)程序一樣,視覺算法本質(zhì)上只是模式匹配機(jī)器。這給了他們一定的優(yōu)勢(shì)(例如,只要你擁有必要的數(shù)據(jù)和計(jì)算能力,他們就可以直接進(jìn)行訓(xùn)練)。但它也給了他們某些弱點(diǎn)(就像他們很容易被他們之前從未見過的輸入混淆的事實(shí))。

        由于研究人員在2010年初發(fā)現(xiàn)了神經(jīng)網(wǎng)絡(luò)在視覺任務(wù)方面的潛力,他們一直在修補(bǔ)自己的力學(xué),試圖弄清楚他們是如何做的。

        早期的一項(xiàng)實(shí)驗(yàn)是DeepDream,這是2015年發(fā)布的計(jì)算機(jī)視覺計(jì)劃,將任何圖片變成了自身的幻覺版本。DeepDream的視覺效果肯定是有趣的(在某些方面,它們成為了人工智能的定義美學(xué)),但該程序也是一個(gè)像算法一樣的早期嘗試。“在某些方面,這一切都始于DeepDream,”奧拉說。

        DeepDream所做的是將圖像調(diào)整為盡可能有趣的算法??雌饋碥浖坪跏窃趫D像中發(fā)現(xiàn)“隱藏”的圖案,但它更像是有人在著色書中涂鴉:用眼睛,莖,螺紋和鼻子填充每一寸,盡可能地激發(fā)算法。

        后來的研究采用了同樣的基本方法并對(duì)其進(jìn)行了微調(diào):首先針對(duì)網(wǎng)絡(luò)中的單個(gè)神經(jīng)元,看看是什么激發(fā)了它們,然后是神經(jīng)元群,然后是網(wǎng)絡(luò)不同層中神經(jīng)元的組合。如果早期的實(shí)驗(yàn)是專注但偶然的,就像Isaac Newton 用鈍針在眼睛里捅自己來理解視力一樣,最近的工作就像Newton用棱鏡分裂一縷光線。它更有針對(duì)性。通過繪制神經(jīng)網(wǎng)絡(luò)的每個(gè)部分中激活的視覺元素,一次又一次,最終,你得到圖集:它的大腦的視覺索引。

        機(jī)器視圖

        但是,激活地圖集實(shí)際上向我們展示了算法的內(nèi)部運(yùn)作方式?嗯,你可以就在谷歌和OpenAI的例子導(dǎo)航開始在這里建退繞稱為GoogLeNet或InceptionV1一個(gè)眾所周知的神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)。

        滾動(dòng),您可以看到網(wǎng)絡(luò)的不同部分如何響應(yīng)不同的概念,以及這些概念如何聚集在一起。(例如,狗只在一個(gè)地方,而鳥類在另一個(gè)地方。)你還可以看到網(wǎng)絡(luò)的不同層代表不同類型的信息。較低級(jí)別更抽象,響應(yīng)基本幾何形狀,而較高級(jí)別將這些解析為可識(shí)別的概念。

        當(dāng)你深入研究個(gè)別分類時(shí),這真的很有趣。谷歌和OpenAI給出的一個(gè)例子是“浮潛”和“潛水員”類別之間的區(qū)別。

        在下圖中,您可以看到神經(jīng)網(wǎng)絡(luò)用于識(shí)別這些標(biāo)簽的各種激活。左邊是與“潛水呼吸”密切相關(guān)的激活,右邊是與“潛水員”密切相關(guān)的激活。中間的激活是在兩個(gè)類之間共享,而條紋上的那些是更多差異化。

        一目了然,你可以看出一些明顯的顏色和圖案。在頂部,你看起來像鮮艷的魚的斑點(diǎn)和條紋,而在底部,有看起來像面具的形狀。但右側(cè)突出顯示的是一種不尋常的激活 - 一種與機(jī)車密切相關(guān)的激活。當(dāng)研究人員發(fā)現(xiàn)這一點(diǎn)時(shí),他們感到困惑。為什么這些關(guān)于機(jī)車的視覺信息對(duì)識(shí)別水肺潛水員很重要?

        “所以我們測(cè)試了它,”卡特說。“我們想,'好吧,如果我們把一輛蒸汽機(jī)車的圖片從一個(gè)潛水員或一個(gè)潛水員那里翻過來?” 它確實(shí)如此。“

        該團(tuán)隊(duì)最終找到了原因:這是因?yàn)闄C(jī)車的光滑金屬曲線在視覺上類似于潛水員的空氣罐。因此,對(duì)于神經(jīng)網(wǎng)絡(luò)來說,這是潛水員和潛水員之間的一個(gè)明顯區(qū)別。為了節(jié)省區(qū)分這兩個(gè)類別的時(shí)間,它只是從其他地方借用了所需的識(shí)別視覺數(shù)據(jù)。

        這種例子令人難以置信地揭示了神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式。對(duì)于懷疑論者,它顯示了這些系統(tǒng)的局限性。他們說,視覺算法可能是有效的,但他們學(xué)到的信息實(shí)際上與人類如何理解世界無關(guān)。這使他們?nèi)菀资艿侥承┰幱?jì)的影響。例如,如果您只將一些精心挑選的像素投射到圖像中,則可能足以使算法對(duì)其進(jìn)行錯(cuò)誤分類。

        但對(duì)于卡特,奧拉和其他類似的人來說,激活地圖集和類似工具所揭示的信息顯示了這些算法的驚人深度和靈活性。例如,Carter指出,為了使算法區(qū)分潛水員和潛水員,它還將不同類型的動(dòng)物與每個(gè)類別聯(lián)系起來。

        “[動(dòng)物]發(fā)生在深水中,像海龜一樣,被水肺覆蓋,表面上出現(xiàn)的像鳥類一樣,被浮潛所覆蓋,”他說。他指出,這是系統(tǒng)從未指導(dǎo)學(xué)習(xí)的信息。相反,它只是自己拾起它。“這有點(diǎn)像對(duì)世界更深刻的理解。這對(duì)我來說真的很令人興奮。“

        奧拉同意。“我發(fā)現(xiàn)在高分辨率下透過這些地圖冊(cè)看起來幾乎令人敬畏,只看到這些網(wǎng)絡(luò)可以代表的巨大空間。”

        他們希望通過開發(fā)這樣的工具,他們將有助于推動(dòng)人工智能的整個(gè)領(lǐng)域。通過了解機(jī)器視覺系統(tǒng)如何看待世界,理論上我們可以更有效地構(gòu)建它們并更徹底地檢查它們的準(zhǔn)確性。

        “我們現(xiàn)在有一個(gè)有限的工具箱,”奧拉說。他說我們可以在系統(tǒng)上拋出測(cè)試數(shù)據(jù)來試圖欺騙他們,但這種方法總是受到我們所知道的錯(cuò)誤的限制。“但這給了我們 - 如果我們想投入精力 - 這是一種表現(xiàn)未知未知問題的新工具,”他說。“感覺就像每一代這些工具讓我們更接近能夠真正理解這些網(wǎng)絡(luò)中正在發(fā)生的事情。”

        最新文章