您現(xiàn)在的位置是:首頁(yè) >要聞 > 2020-12-04 08:19:29 來(lái)源:
神經(jīng)科學(xué)家找到一種使對(duì)象識(shí)別模型表現(xiàn)更好的方法
可以訓(xùn)練稱為卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)視覺(jué)模型來(lái)識(shí)別與人類幾乎一樣準(zhǔn)確的物體。但是,這些模型有一個(gè)重大缺陷:圖像的很小變化幾乎不會(huì)被人類觀看者察覺(jué),會(huì)誘使他們做出嚴(yán)重錯(cuò)誤,例如將貓分類為樹(shù)。
麻省理工學(xué)院,哈佛大學(xué)和IBM的神經(jīng)科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)了一種緩解此漏洞的方法,方法是在這些模型中添加一個(gè)新層,該層旨在模擬大腦視覺(jué)處理系統(tǒng)的最早階段。在一項(xiàng)新的研究中,他們表明,該層大大提高了模型針對(duì)此類錯(cuò)誤的魯棒性。
麻省理工學(xué)院的博士后,一位科學(xué)家該研究的主要作者。
卷積神經(jīng)網(wǎng)絡(luò)通常用于人工智能應(yīng)用中,例如自動(dòng)駕駛汽車,自動(dòng)裝配線和醫(yī)療診斷。哈佛大學(xué)研究生喬爾·達(dá)佩羅(Joel Dapello)也是該研究的主要作者,并補(bǔ)充說(shuō):“實(shí)施我們的新方法可能使這些系統(tǒng)更不容易出錯(cuò),更符合人類視覺(jué)。”
詹姆士·迪卡洛(James DiCarlo)說(shuō):“根據(jù)定義,關(guān)于大腦視覺(jué)系統(tǒng)如何運(yùn)作的良好科學(xué)假設(shè)應(yīng)該使大腦在內(nèi)部神經(jīng)模式和非凡的健壯性方面都與大腦相匹配。這項(xiàng)研究表明,獲得這些科學(xué)收益直接導(dǎo)致了工程和應(yīng)用收益。” ,麻省理工學(xué)院腦與認(rèn)知科學(xué)系主任,大腦,思維與機(jī)器中心和麥戈文腦科學(xué)研究所的研究員,以及該研究的高級(jí)作者。
這項(xiàng)研究將在本月的NeurIPS會(huì)議上進(jìn)行介紹,它也是由MIT研究生Martin Schrimpf,MIT來(lái)訪學(xué)生Franziska Geiger和MIT-IBM Watson AI實(shí)驗(yàn)室主任David Cox共同撰寫的。
識(shí)別對(duì)象是視覺(jué)系統(tǒng)的主要功能之一。在短短一秒鐘的時(shí)間內(nèi),視覺(jué)信息就通過(guò)腹側(cè)視覺(jué)流流到大腦下顳葉皮層,在此大腦神經(jīng)元包含對(duì)物體進(jìn)行分類所需的信息。在腹側(cè)流的每個(gè)階段,大腦執(zhí)行不同類型的處理。腹側(cè)流的第一個(gè)階段V1是大腦中最有特色的部分之一,其中包含對(duì)簡(jiǎn)單的視覺(jué)特征(例如邊緣)做出反應(yīng)的神經(jīng)元。