您現(xiàn)在的位置是:首頁(yè) >人工智能 > 2022-11-12 20:09:24 來(lái)源:
通過(guò)游戲進(jìn)行優(yōu)化和決策的多智能體系統(tǒng)
在人工智能中,多智能體系統(tǒng)可以被認(rèn)為是一個(gè)由個(gè)人(智能體)組成的社會(huì),他們通過(guò)交流知識(shí)和談判來(lái)實(shí)現(xiàn)個(gè)人/全球目標(biāo)。在現(xiàn)實(shí)生活中,多智能體系統(tǒng)用于資源管理;信息安全;制造計(jì)劃、調(diào)度和控制;監(jiān)測(cè)、診斷和控制;電子商務(wù);生物醫(yī)學(xué);和虛擬企業(yè)。鑒于它們的巨大用途,研究人員不斷試圖尋找在現(xiàn)實(shí)世界中使用這些系統(tǒng)的新方法。
華東理工大學(xué)唐洋教授,澳大利亞斯威本科技大學(xué)歐洲科學(xué)院院士、IEEE院士韓慶龍教授,德國(guó)波茨坦氣候影響研究所歐洲科學(xué)院院士尤爾根·庫(kù)爾特斯教授,共同深入挖掘與多代理系統(tǒng)相關(guān)的問(wèn)題。他們探索了從優(yōu)化到博弈的多智能體系統(tǒng)的合作/非合作行為的本質(zhì),作為解決復(fù)雜現(xiàn)實(shí)世界問(wèn)題的方法。
“多智能體系統(tǒng)通常涉及目標(biāo)沖突的多目標(biāo)優(yōu)化,每個(gè)對(duì)象都不可避免地受到不確定性的影響。因此,博弈論可以為多智能體系統(tǒng)提供更多的解決方案,并提供跨學(xué)科整合的手段,例如博弈與控制、人工智能、數(shù)學(xué)和其他學(xué)科的整合。
他們考慮博弈論有一個(gè)重要原因。游戲,尤其是回合制策略游戲,在我們身邊無(wú)處不在。博弈是針對(duì)相互依存的情況,根據(jù)主體的行為和動(dòng)作順序,可以分為合作博弈和非合作博弈,也可以分為靜態(tài)博弈和動(dòng)態(tài)博弈。研究人員已經(jīng)整合了這兩種分類,以便更全面地了解復(fù)雜的現(xiàn)實(shí)世界場(chǎng)景。
在他們的調(diào)查中,作者使用博弈論為個(gè)人或全局優(yōu)化目標(biāo)創(chuàng)建合作或競(jìng)爭(zhēng)行為模型。重點(diǎn)是多智能體系統(tǒng)中合作與競(jìng)爭(zhēng)的三個(gè)方面:合作優(yōu)化、合作博弈和非合作博弈。“對(duì)于與游戲相關(guān)的問(wèn)題,當(dāng)一個(gè)智能體的目標(biāo)可能與其他智能體的目標(biāo)不同或完全相反時(shí),就會(huì)形成非合作博弈;相反,當(dāng)一個(gè)代理人絕對(duì)與其他代理人合作并考慮共同利益時(shí),就會(huì)形成合作博弈。
調(diào)查從多個(gè)角度進(jìn)行研究:首先,聚焦分布式在線優(yōu)化、聯(lián)邦優(yōu)化及其在隱私保護(hù)中的應(yīng)用。然后,通過(guò)分別關(guān)注具有合作和競(jìng)爭(zhēng)因素的靜態(tài)和動(dòng)態(tài)博弈,該研究以新穎的方式彌合了從合作優(yōu)化到合作博弈的過(guò)渡。
那么這些發(fā)現(xiàn)可以在哪里使用呢?
作者使用一個(gè)特別說(shuō)明性的例子說(shuō):“在智慧城市中,這些發(fā)現(xiàn)可用于構(gòu)建依賴城市大數(shù)據(jù)的智能交通決策系統(tǒng)。這意味著可以優(yōu)化路口紅綠燈的持續(xù)時(shí)間,從而調(diào)節(jié)流量,平衡路網(wǎng)負(fù)荷,提高道路資源的利用效率。
應(yīng)用范圍也包括其他領(lǐng)域。在經(jīng)濟(jì)學(xué)中,市場(chǎng)競(jìng)爭(zhēng)可以建模為博弈問(wèn)題。在信息安全中,通過(guò)識(shí)別交互信息的意圖和預(yù)測(cè)攻擊行為,可以構(gòu)建非合作攻防博弈,找到最優(yōu)的防御策略。即使在藥物開發(fā)中,也可以構(gòu)建合作博弈以獲得大分子結(jié)構(gòu)的最大效用。