您現(xiàn)在的位置是:首頁(yè) >生活 > 2021-04-08 08:19:01 來(lái)源:
普渡大學(xué)的研究人員使用人工智能從Wi-Fi數(shù)據(jù)中預(yù)測(cè)學(xué)生的位置和朋友
基于位置的簽到顯示了很多關(guān)于一個(gè)人 - 特別是大學(xué)生,事實(shí)證明。普渡大學(xué)的研究人員在上個(gè)月早些時(shí)候在預(yù)印本服務(wù)器Arxiv.org上發(fā)表了一篇論文(“ 探索改進(jìn)興趣點(diǎn)預(yù)測(cè)的學(xué)生登記行為 ”),描述了Wi-Fi訪(fǎng)問(wèn)日志如何用于識(shí)別用戶(hù)之間的相關(guān)性學(xué)術(shù)環(huán)境中的地點(diǎn)和活動(dòng)。
使用AI預(yù)測(cè)位置數(shù)據(jù)中的位置和友誼可能聽(tīng)起來(lái)有點(diǎn)令人毛骨悚然,真實(shí)。但從好的方面來(lái)說(shuō),它不像人工智能那樣可以通過(guò)眼球運(yùn)動(dòng)來(lái)預(yù)測(cè)人格特質(zhì)。
“在興趣點(diǎn)(POI)任務(wù)中,目標(biāo)是使用用戶(hù)行為數(shù)據(jù)來(lái)模擬用戶(hù)在不同位置和時(shí)間的活動(dòng),然后根據(jù)他們當(dāng)前的背景進(jìn)行預(yù)測(cè)(或針對(duì)相關(guān)場(chǎng)所的建議,”研究人員寫(xiě)道:“在這項(xiàng)工作中,我們首先分析了時(shí)空教育'登記'數(shù)據(jù)集,目的是使用POI預(yù)測(cè)來(lái)個(gè)性化學(xué)生的建議......并了解提高學(xué)生保留率和滿(mǎn)意度的行為模式。結(jié)果還可以更好地了解校園設(shè)施的使用方式以及學(xué)生之間的聯(lián)系方式。“
該團(tuán)隊(duì)指出,在大多數(shù)之前的POI研究中,數(shù)據(jù)集主要包括來(lái)自Foursquare或Yelp等社交網(wǎng)絡(luò)應(yīng)用程序的自愿簽到。因此,他們對(duì)餐館和娛樂(lè)熱點(diǎn)的信息“豐富”,但沒(méi)有對(duì)“平淡無(wú)奇”的活動(dòng)有所了解,比如到辦公室,離開(kāi)家,或跑一個(gè)差事。此外,由于為他們做出貢獻(xiàn)的用戶(hù)經(jīng)常只訪(fǎng)問(wèn)一次場(chǎng)地,因此他們可能會(huì)得出有偏見(jiàn)的結(jié)論,并且難以確定一致的模式。
研究人員選擇用Wi-Fi解決問(wèn)題 - 普渡大學(xué)的Wi-Fi。他們?cè)谡撐闹刑岢龅膬?yōu)勢(shì)是“更好的時(shí)間分辨率”,因?yàn)槊總€(gè)用戶(hù)的Wi-Fi訪(fǎng)問(wèn)歷史數(shù)據(jù)量非常大。(當(dāng)他們的設(shè)備無(wú)線(xiàn)發(fā)送或接收數(shù)據(jù)包時(shí),參與研究的學(xué)生“簽入”,導(dǎo)致最終達(dá)到376GB的日志文件。)在將這些數(shù)據(jù)與位置的場(chǎng)地信息配對(duì)后,論文的作者能夠分析所有新生普渡大學(xué)學(xué)生在2016-2017學(xué)年的運(yùn)動(dòng)。
數(shù)據(jù)集中的每個(gè)條目包含四個(gè)項(xiàng)目:用戶(hù),興趣點(diǎn),興趣點(diǎn)功能(例如,居住或娛樂(lè))和時(shí)間跨度(在給定位置花費(fèi)的時(shí)間量)。在處理之后,處理的樣本包括少于100個(gè)簽入和其他步驟的用戶(hù),處理后的樣本有5.4億個(gè)日志。
它揭示了一些有趣的趨勢(shì)。例如,在工作日,學(xué)生們?cè)谙挛?2點(diǎn)和下午6點(diǎn)前往餐廳,并在晚上8點(diǎn)左右去健身房。可以預(yù)見(jiàn),新生在很快(在前2-3周內(nèi))探索校園,然后堅(jiān)持修復(fù),在學(xué)期剩余時(shí)間內(nèi)熟悉的建筑范圍。而且偏好因?qū)I(yè)而異。計(jì)算機(jī)科學(xué)學(xué)生和藥學(xué)學(xué)生同時(shí)用餐,但后者在上午11點(diǎn)到下午12點(diǎn)之間更多地上課.CS學(xué)生從早上到下午打書(shū),花了更多時(shí)間在學(xué)術(shù)建筑上,而藥房學(xué)生則把它帶到了后來(lái)的重量室。
在進(jìn)行了額外的處理和索引之后,研究人員按照時(shí)間順序?qū)η?0個(gè)登記記錄中的一系列機(jī)器學(xué)習(xí)模型進(jìn)行了培訓(xùn),并保留了剩余的20%%用于測(cè)試。他們提出的人工智能系統(tǒng) - 嵌入密集的異構(gòu)圖形或EDHG - 能夠準(zhǔn)確地預(yù)測(cè)學(xué)生訪(fǎng)問(wèn)過(guò)的前三個(gè)位置,準(zhǔn)確率分別為85%%和31%%,前十位,準(zhǔn)確度分別為90%%和71%%。
接下來(lái),該論文的作者將其放在“合作事件”上 - 當(dāng)兩名學(xué)生同時(shí)在同一個(gè)地方時(shí)。他們推測(cè)它可以表明人與人之間的關(guān)系 - 即友誼。
EDHG在這方面做得很好,建議為每個(gè)用戶(hù)列出10個(gè)潛在朋友,這些朋友的表現(xiàn)優(yōu)于基線(xiàn)中最先進(jìn)的方法。然而,研究人員指出,針對(duì)不太活躍用戶(hù)的建議 - 即簽到次數(shù)較少的用戶(hù) - 往往不太準(zhǔn)確。
他們留待將來(lái)的工作將合作數(shù)據(jù)納入AI模型,他們希望這將顯示社交互動(dòng)是否會(huì)影響學(xué)生的登記行為。
“這些初步結(jié)果表明了將學(xué)生軌跡信息用于教育應(yīng)用中的個(gè)性化推薦的承諾,”他們寫(xiě)道,“以及學(xué)生保留和滿(mǎn)意度的預(yù)測(cè)模型。”
讓我們希望未來(lái)的用例與研究人員預(yù)測(cè)的一樣無(wú)害。