您現(xiàn)在的位置是:首頁(yè) >要聞 > 2020-11-24 17:16:30 來(lái)源:
算法提高了搜索結(jié)果的公平性
當(dāng)您在Internet上搜索內(nèi)容時(shí),您是一頁(yè)一頁(yè)地瀏覽建議還是從前幾個(gè)選擇中進(jìn)行選擇?由于大多數(shù)人都是從這些列表的頂部進(jìn)行選擇的,因此他們很少看到絕大多數(shù)選項(xiàng),從而在從招聘到媒體曝光到電子商務(wù)等各個(gè)方面都產(chǎn)生了偏見(jiàn)。
在一份新論文中,康奈爾大學(xué)的研究人員介紹了他們開(kāi)發(fā)的一種工具,可以在不犧牲其實(shí)用性或相關(guān)性的情況下提高在線(xiàn)排名的公正性。
計(jì)算機(jī)科學(xué)博士生Ashudeep Singh說(shuō):“如果您可以平等地檢查所有選擇,然后決定選擇什么,那將是理想選擇。但是,由于我們無(wú)法做到這一點(diǎn),因此排名成為導(dǎo)航這些選擇的關(guān)鍵界面。” “在動(dòng)態(tài)學(xué)習(xí)到排名中控制公平和偏差”一書(shū)的第一作者,該書(shū)在7月25日至30日舉行的計(jì)算機(jī)科學(xué)協(xié)會(huì)SIGIR信息檢索研究與開(kāi)發(fā)會(huì)議上獲得了最佳論文獎(jiǎng)。
辛格說(shuō):“例如,許多YouTube員工會(huì)發(fā)布相同食譜的視頻,但是其中一些視頻的觀看者比其他人更多,即使他們可能非常相似。” “這是由于搜索結(jié)果呈現(xiàn)給我們的方式而發(fā)生的。我們通常以線(xiàn)性方式降低排名,而注意力迅速下降。”
研究人員的方法稱(chēng)為FairCo,可以使他們大致平等地接受同樣相關(guān)的選擇,并避免對(duì)已經(jīng)排在首位的物品給予優(yōu)惠待遇。這可以糾正現(xiàn)有算法中固有的不公平現(xiàn)象,從而加劇不平等和政治分化,并減少個(gè)人選擇。
“他們?nèi)绾畏峙淦毓饴逝琶到y(tǒng)。那么,我們?nèi)绾未_保每個(gè)人都能獲得應(yīng)有的曝光率呢?” 計(jì)算機(jī)科學(xué)和信息科學(xué)教授,論文的高級(jí)作者Thorsten Joachims說(shuō)。“例如,在電子商務(wù)系統(tǒng)和對(duì)職位空缺進(jìn)行排名的系統(tǒng)中,構(gòu)成公平性的方法可能大不相同。我們提出了可讓您指定公平性標(biāo)準(zhǔn)的計(jì)算工具,以及可證明強(qiáng)制執(zhí)行的算法他們。”
在線(xiàn)排名系統(tǒng)最初基于1960年代和70年代的圖書(shū)館學(xué),旨在使用戶(hù)更輕松地找到他們想要的書(shū)。但是,這種方法在兩面市場(chǎng)中可能是不公平的,在兩面市場(chǎng)中,一個(gè)實(shí)體想要找到東西,而另一個(gè)實(shí)體想要找到。
Joachims說(shuō):“在優(yōu)化排名中,許多機(jī)器學(xué)習(xí)工作仍然非常專(zhuān)注于最大化用戶(hù)的效用。” “過(guò)去幾年中我們所做的是提出有關(guān)如何最大程度地提高實(shí)用性,同時(shí)仍然對(duì)所搜索項(xiàng)目公平的概念。”
優(yōu)先處理較受歡迎商品的算法可能不公平,因?yàn)榱斜碇谐霈F(xiàn)的選項(xiàng)越高,用戶(hù)點(diǎn)擊并做出反應(yīng)的可能性就越大。這會(huì)造成“富人致富”現(xiàn)象,其中一種選擇變得越來(lái)越流行,而其他選擇則消失了。
算法還尋找與搜索者最相關(guān)的項(xiàng)目,但是由于絕大多數(shù)人都選擇了列表中的前幾個(gè)項(xiàng)目之一,因此相關(guān)性的微小差異可能會(huì)導(dǎo)致曝光差異巨大。例如,如果該新聞出版物的讀者中有51%偏愛(ài)偏向保守的觀點(diǎn),而49%偏愛(ài)比較自由的文章,則可以認(rèn)為主頁(yè)上突出顯示的所有頭條新聞都傾向于保守。
喬阿希姆斯說(shuō):“當(dāng)相關(guān)性的微小差異導(dǎo)致一方擴(kuò)大時(shí),通常會(huì)導(dǎo)致兩極分化,一些人傾向于主導(dǎo)對(duì)話(huà),而其他意見(jiàn)則被忽視,而沒(méi)有引起他們的公平關(guān)注。” “您可能希望在電子商務(wù)系統(tǒng)中使用它,以確保如果您要生產(chǎn)30%的人喜歡的產(chǎn)品,則可以以此為基礎(chǔ)獲得一定的曝光?;蛘?,如果您有簡(jiǎn)歷,數(shù)據(jù)庫(kù),您可以制定保障措施以確保它不會(huì)因種族或性別而受到歧視。”