您現(xiàn)在的位置是:首頁 >市場 > 2021-04-23 09:28:07 來源:
谷歌正在讓人工智能開發(fā)人員更容易將用戶數(shù)據(jù)保密
谷歌已經(jīng)宣布了一個(gè)新的模塊,用于其機(jī)器學(xué)習(xí)框架TensorFlow,它允許開發(fā)人員只需幾行額外代碼即可改善其AI模型的隱私。TensorFlow是用于構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用程序的最流行的工具之一,它被世界各地的開發(fā)人員用于創(chuàng)建文本,音頻和圖像識(shí)別算法等程序。隨著TensorFlow Privacy的引入,這些開發(fā)人員將能夠使用稱為“差異隱私”的統(tǒng)計(jì)技術(shù)來保護(hù)用戶的數(shù)據(jù)。
谷歌產(chǎn)品經(jīng)理Carey Radebaugh告訴The Verge,推出這款工具符合谷歌負(fù)責(zé)人工智能開發(fā)的原則。“如果我們沒有將差異隱私納入TensorFlow,那么我們就知道,對(duì)于Google內(nèi)外的團(tuán)隊(duì)來說,使用它并不容易,”Radebaugh說。“因此,對(duì)我們來說,重要的是將其納入TensorFlow,開源,并開始圍繞它創(chuàng)建這個(gè)社區(qū)。”
差異隱私的機(jī)制有點(diǎn)復(fù)雜,但它本質(zhì)上是一種數(shù)學(xué)方法,這意味著在用戶數(shù)據(jù)上訓(xùn)練的AI模型不能編碼個(gè)人可識(shí)別信息。這是保護(hù)在AI模型中創(chuàng)建所需個(gè)人信息的常用方法:Apple將其用于iOS 10中的自有AI服務(wù),Google將其用于許多自己的AI功能,如Gmail的智能回復(fù)。
要了解這些服務(wù)對(duì)隱私構(gòu)成的危害,請(qǐng)考慮智能回復(fù)如何依賴從超過10億Gmail用戶收集的數(shù)據(jù)來做出建議的回復(fù)。這些數(shù)據(jù)顯然包括非常個(gè)人的信息(基本上是你曾經(jīng)放在電子郵件中的任何信息),如果智能回復(fù)出現(xiàn)這種情況,例如,通過建議回復(fù)另一個(gè)用戶所寫的電子郵件,這將是災(zāi)難性的。
差異隱私以“數(shù)學(xué)確定性”消除了這種可能性,谷歌的研究科學(xué)家ÚlfarErlingsson說,他已經(jīng)在數(shù)據(jù)隱私領(lǐng)域工作了20年。Erlingsson告訴The Verge,這是一種從數(shù)據(jù)集中刪除可識(shí)別的異常值而不改變數(shù)據(jù)的聚合含義的技術(shù)。“你的結(jié)果獨(dú)立于任何一個(gè)人的[數(shù)據(jù)],但這仍然是一個(gè)很好的結(jié)果。”
但是,使用差異隱私有一些缺點(diǎn)。“通過屏蔽異常值,它有時(shí)可以刪除相關(guān)或有趣的數(shù)據(jù),尤其是在各種數(shù)據(jù)集中,例如涉及語言的數(shù)據(jù)集,”Erlingsson說。“差異隱私字面意思是系統(tǒng)不可能了解在數(shù)據(jù)集中只發(fā)生過一次的任何事情,因此你就有這種緊張感。你需要獲得更多某種類型的數(shù)據(jù)嗎?數(shù)據(jù)集中的這些獨(dú)特屬性有多相關(guān)或有用?“
但谷歌希望通過發(fā)布TensorFlow Privacy,全球更多的AI開發(fā)人員將開始使用這種技術(shù),這些問題可以得到改善。“有一些工作要做,以便更容易找出這種權(quán)衡,”拉德博說。
最終,谷歌表示,最好讓更多的大腦參與進(jìn)來,發(fā)布新的開源工具可以增加可用人才庫。Erlingsson說,此外,只需使用“四到五行[代碼]和一些超參數(shù)調(diào)整”就可以為AI模型添加差異隱私,這本身就是一大進(jìn)步。“就像幾個(gè)月前我們所處的世界一樣,這是一個(gè)非常不同的世界,所以我們?yōu)榇烁械椒浅W院馈?rdquo;