您現(xiàn)在的位置是:首頁 >綜合 > 2020-12-11 09:05:15 來源:
人工智能可能成為積極的社會(huì)變革的力量
人工智能(AI)已經(jīng)以引人注目的方式重新構(gòu)造了世界。數(shù)據(jù)驅(qū)動(dòng)著我們的全球數(shù)字生態(tài)系統(tǒng),人工智能技術(shù)揭示了數(shù)據(jù)的模式。智能手機(jī),智能家居和智能城市會(huì)影響我們的生活和互動(dòng)方式,人工智能系統(tǒng)越來越多地參與招聘決策,醫(yī)療診斷和司法判決。此方案是烏托邦式還是反烏托邦式取決于您的觀點(diǎn)。
反復(fù)列舉了AI的潛在風(fēng)險(xiǎn)。殺手機(jī)器人和大規(guī)模失業(yè)是人們普遍關(guān)心的問題,而有些人甚至擔(dān)心人類的滅絕。更樂觀的預(yù)測認(rèn)為,到2030年,人工智能將為世界經(jīng)濟(jì)增加15萬億美元,并最終使我們走向某種社會(huì)的必殺技。
我們當(dāng)然需要考慮這些技術(shù)對我們社會(huì)的影響。一個(gè)重要的問題是,人工智能系統(tǒng)會(huì)加劇現(xiàn)有的社會(huì)偏見,從而造成破壞性影響。這種現(xiàn)象的幾個(gè)臭名昭著的例子受到了廣泛的關(guān)注:產(chǎn)生性別歧視輸出的最先進(jìn)的自動(dòng)機(jī)器翻譯系統(tǒng),以及將黑人分類為大猩猩的圖像識(shí)別系統(tǒng)。
之所以出現(xiàn)這些問題,是因?yàn)榇祟愊到y(tǒng)使用數(shù)學(xué)模型(例如神經(jīng)網(wǎng)絡(luò))來識(shí)別大量訓(xùn)練數(shù)據(jù)中的模式。如果該數(shù)據(jù)以各種方式嚴(yán)重歪斜,那么受過訓(xùn)練的系統(tǒng)將不可避免地學(xué)習(xí)和再現(xiàn)其固有偏差。偏向自主的技術(shù)存在問題,因?yàn)樗鼈兛赡苁怪T如婦女,少數(shù)民族或老年人等群體邊緣化,從而加劇了現(xiàn)有的社會(huì)失衡。
例如,如果對AI系統(tǒng)進(jìn)行了關(guān)于警察逮捕數(shù)據(jù)的培訓(xùn),那么現(xiàn)有逮捕模式中出現(xiàn)的任何有意識(shí)或無意識(shí)的偏見都將通過在該數(shù)據(jù)上受過訓(xùn)練的“預(yù)測性警務(wù)” AI系統(tǒng)進(jìn)行復(fù)制。認(rèn)識(shí)到這一點(diǎn)的嚴(yán)重影響,各種權(quán)威組織最近建議,所有AI系統(tǒng)都應(yīng)接受無偏數(shù)據(jù)的培訓(xùn)。歐盟委員會(huì)在2019年初發(fā)布的道德準(zhǔn)則提出了以下建議:“收集數(shù)據(jù)時(shí),可能包含社會(huì)構(gòu)造的偏見,不準(zhǔn)確性,錯(cuò)誤和錯(cuò)誤。在使用任何給定數(shù)據(jù)集進(jìn)行培訓(xùn)之前,必須解決這些問題。”
處理偏差數(shù)據(jù)
這一切聽起來都足夠明智。但不幸的是,有時(shí)根本不可能在訓(xùn)練之前確保某些數(shù)據(jù)集沒有偏見。一個(gè)具體的例子應(yīng)該澄清這一點(diǎn)。
所有最新的機(jī)器翻譯系統(tǒng)(例如Google Translate)都經(jīng)過句子對訓(xùn)練。英語-法語系統(tǒng)使用將英語句子(“她很高”)與等效的法語句子(“ elle est grande ”)相關(guān)聯(lián)的數(shù)據(jù)。在給定的一組訓(xùn)練數(shù)據(jù)中,可能有5億個(gè)這樣的配對,因此總共有10億個(gè)單獨(dú)的句子。如果我們想防止所得的系統(tǒng)產(chǎn)生如下性別歧視輸出,則需要從此類數(shù)據(jù)集中消除所有與性別相關(guān)的偏見:
輸入:婦女開始開會(huì)。他們有效地工作。
輸出:萊斯FEMMES ONT開始留尼汪島。它可以改善身體狀況。
法語翻譯是使用Google翻譯于2019年10月11日生成的,并且是錯(cuò)誤的:“ Ils ”是法語中的男性復(fù)數(shù)主語代詞,盡管上下文明確表明正在提及女性,但它還是出現(xiàn)在此處。這是經(jīng)典的例子,由于訓(xùn)練數(shù)據(jù)存在偏差,自動(dòng)化系統(tǒng)會(huì)優(yōu)先使用男性默認(rèn)值。
通常,翻譯數(shù)據(jù)集中有70%的性別代詞是男性的,而30%是女性的。這是因?yàn)橛糜诖四康牡奈谋舅傅氖悄行远皇桥浴榱朔乐狗g系統(tǒng)復(fù)制這些現(xiàn)有的偏見,必須從數(shù)據(jù)中刪除特定的句子對,以使英語和法語雙方出現(xiàn)男性和女性代詞的比例分別為50%/ 50%。這將防止系統(tǒng)為男性代詞分配更高的概率。