您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-02 17:11:06 來源:
研究人員訓(xùn)練技術(shù)工具從書面對(duì)話中找到關(guān)系線索
社會(huì)科學(xué)家已經(jīng)確定了十個(gè)維度來描述人際關(guān)系的本質(zhì),但是很少有研究集中在如何通過書面語言表達(dá)這些概念以及它們在形成社會(huì)互動(dòng)中的作用。
密歇根大學(xué)和諾基亞貝爾實(shí)驗(yàn)室的最新研究已使用眾包和一種技術(shù)工具來檢測這些特征如何以日常語言表達(dá)以及它們?nèi)绾斡绊懮鐣?huì)動(dòng)態(tài)。
該團(tuán)隊(duì)使用自然語言處理來預(yù)測社會(huì)維度,包括人與人之間的關(guān)系,例如沖突或支持之一,以及他們所塑造的現(xiàn)實(shí)世界社區(qū)的類型(例如,富人或被剝奪者)。
“我們首先演示了如何構(gòu)建模型以測量給定對(duì)話中每個(gè)維度的水平。然后我們證明了我們的模型在預(yù)測對(duì)話中存在的維度以及個(gè)人之間更高層次的預(yù)測方面表現(xiàn)出色”,信息學(xué)院的博士生Minje Choi在諾基亞貝爾實(shí)驗(yàn)室實(shí)習(xí)期間進(jìn)行了這項(xiàng)研究。
“我們還表明,知識(shí)或社會(huì)支持等層面的水平可能與社會(huì)結(jié)果有關(guān),例如他們的財(cái)富水平或自殺率是多少。”
該研究的第一作者崔和同事使用眾包技術(shù)首先根據(jù)以下10個(gè)特征識(shí)別消息:知識(shí),能力,地位,信任,支持,浪漫,相似性,同一性,樂趣和沖突。
900多個(gè)眾包注釋者在Reddit帖子中標(biāo)記了7,855個(gè)句子,在電影界中標(biāo)記了400個(gè),在Enron電子郵件中標(biāo)記了436個(gè),表明了這10個(gè)特征的存在。
然后,研究人員訓(xùn)練了一種深度學(xué)習(xí)分類工具,以查找這些特征及其在所有Reddit和Enron消息以及電影對(duì)話中所表現(xiàn)的關(guān)系。
他們還使用了來自Tinghy.org的數(shù)據(jù),這是一項(xiàng)游戲化的心理測驗(yàn),旨在使用10個(gè)維度來衡量Twitter用戶對(duì)其在線關(guān)系的看法。他們研究了1,406個(gè)獨(dú)特個(gè)體之間的1,772個(gè)關(guān)系。
除了確定消息中的已知維度外,研究人員還發(fā)現(xiàn):
知識(shí)是教育水平和收入的最重要的重要預(yù)測指標(biāo)。
支持的存在和不信任是自殺率的兩個(gè)最重要的預(yù)測指標(biāo)。
受高等教育程度較高的州顯示出較低的沖突水平,這與研究發(fā)現(xiàn)仇恨言論是受較低的教育水平推動(dòng)的研究一致。
財(cái)富與減少的表達(dá)方式相關(guān),這些表達(dá)方式表明觀點(diǎn)之間的相似性,這是結(jié)構(gòu)和文化上不同的社區(qū)的可能標(biāo)志。
Choi說,團(tuán)隊(duì)的希望是其他人將使用他們的模型來繼續(xù)探索關(guān)系維度和書面交流之間的聯(lián)系。
Choi說:“對(duì)于擁有這些對(duì)話數(shù)據(jù)并想要衡量水平或維度變化(例如,社會(huì)支持或數(shù)據(jù)沖突)的研究人員,它可以用作分析工具。” “它可以用來尋找時(shí)間變化(如我們在安然的例子中所做的那樣)或社區(qū)方面的差異(如我們在美國州級(jí)Reddit評(píng)論中所做的那樣)。