您現(xiàn)在的位置是:首頁 >生活 > 2021-04-19 07:35:03 來源:
AI幫助研究人員模擬社會規(guī)范的影響
人類如何學會合作?這是一個有趣的問題,一位行為人類學家已經(jīng)研究了幾十年。社會規(guī)范 - 即共同理解或非正式規(guī)則,如用餐禮儀和時尚感 - 被認為是其中的一部分,但很難衡量它們塑造社會的程度以及它們如何受到其他因素的影響。
在最新發(fā)表的關于預印本服務器Arxiv.org的論文中(“ 通過多智能體強化學習理解合作伙伴選擇對合作和社會規(guī)范的影響 ”),科學家描述了一個使用強化學習訓練的人工智能系統(tǒng) - 一種使用的技術獎勵推動代理人實現(xiàn)目標 - 了解社會內部的互動如何影響整體社會結果。
“我們首先研究了規(guī)范的出現(xiàn),然后出現(xiàn)了規(guī)范存在的合作,”該論文的作者解釋說。“[規(guī)范]已被證明對社會的集體結果和進展產(chǎn)生了巨大的影響,[但]雖然有人認為規(guī)范行為是從社會互動中產(chǎn)生的,但尚不清楚可能會出現(xiàn)什么樣的行為??紤]到一些社會配置。“
研究人員將兩種社會困境塑造為游戲:基于合作的游戲,暴露個人目標與團體目標之間的緊張關系,以及基于協(xié)調的游戲,檢查整合,每個代理人都對其環(huán)境進行部分觀察。所述代理人 - 總共50人 - 的任務是獲得最高的累積分數(shù),同時試圖最大化他們的個人分數(shù)。通過跟蹤聚合到特定點的代理的數(shù)量來評估規(guī)范的出現(xiàn)。
在實驗中,個體經(jīng)紀人通過選擇或隨機反復與他人互動,并根據(jù)他們的經(jīng)歷學習行為。在協(xié)調游戲的10,000集之后,那些在合作伙伴中有選擇權的人能夠維持規(guī)范,并在新代理人類型 - “影響”代理人 - 出現(xiàn)固定策略的情況下表現(xiàn)出對變化的抵制。與此同時,大約5000集的合作游戲表明,合作伙伴的選擇促進了規(guī)范存在的合作; 使用代理人可以自由選擇合作伙伴的弱規(guī)范,代理商幾乎完全與其他過去合作的代理商配對。
研究人員寫道:“通過同化或監(jiān)督,代理人可以自由選擇誰可以在社會中進行互動,從而更難以影響或規(guī)范社會行為。” “這是穩(wěn)定合作的關鍵因素,因為避免了不值得信賴的代理人,隨著社會規(guī)范得到加強,合作行為可以得到加強。”
他們認為這些研究結果可能被用作未來自治系統(tǒng)設計的基礎,也許可以提供對人類和動物社會合作出現(xiàn)的見解。