清華用7個(gè)ChatGPT模擬《狼人殺》,結(jié)果出乎意料!

      后臺(tái)-系統(tǒng)設(shè)置-擴(kuò)展變量-手機(jī)廣告位-內(nèi)容正文頂部

      為了驗(yàn)證大語(yǔ)言模型的溝通、規(guī)劃、反思等擬人化能力,清華研究團(tuán)隊(duì)發(fā)布了一篇名為“探索大語(yǔ)言模型在交流游戲中的應(yīng)用:《狼人殺》實(shí)驗(yàn)”的研究論文。

      結(jié)果顯示,通過(guò)ChatGPT(GPT -turbo-0301)構(gòu)建的7個(gè)玩家,在《狼人殺》游戲中展示出了信任、對(duì)抗、偽裝和領(lǐng)導(dǎo)的擬人化能,而研究人員沒(méi)有進(jìn)行任何干預(yù)和教導(dǎo)。

      此前,斯坦福研究中心發(fā)布了一篇名為《Generative Agents: Interactive Simulacra of Human Behavior》的論文。

      同樣使用ChatGPT(GPT-3.5-turbo)打造了一個(gè)模擬小鎮(zhèn),25名AI代理在自由交流空間下,居然出現(xiàn)了友誼、學(xué)習(xí)計(jì)劃、相互協(xié)調(diào)、共享信息等擬人化能力,這證明大語(yǔ)言模型在游戲、客服等領(lǐng)域擁有非常寬廣的應(yīng)用場(chǎng)景。

      事實(shí)上,育碧、Take-Two Interactive、Bethesda Game Studios、Electronic Arts、CD Projekt等世界頂級(jí)游戲開(kāi)發(fā)商,已經(jīng)計(jì)劃在游戲中使用生成式AI,增加游戲的趣味性、可玩性以及NPC的自由發(fā)揮空間。

      論文地址:https://arxiv.org/abs/2309.04658

      游戲背景

      在本次《狼人殺》游戲測(cè)試中,一共有7名AI玩家,分別是2名狼人、2名村民、1名女巫、1名守衛(wèi)和1名預(yù)言家

      分為狼人和村民兩大陣營(yíng),村民方包括普通村民和特殊角色(女巫、守衛(wèi)和預(yù)言家)。

      狼人的任務(wù)是殺光村民,而村民則要消滅所有狼人。想贏得游戲,村民方在游戲結(jié)束時(shí)至少需要有一名存活的村民。

      游戲分為白天和晚上兩個(gè)階段。晚上,狼人會(huì)投票殺死一個(gè)角色;白天,所有存活的玩家討論后投票決定消滅一個(gè)疑似狼人的角色。

      特殊角色的能力:女巫有一次救人或殺人的機(jī)會(huì);守衛(wèi)每晚能保護(hù)一個(gè)角色;預(yù)言家每晚能查驗(yàn)一個(gè)角色的身份。

      狼人殺游戲的特點(diǎn)在于,玩家初始只知道自己的角色,必須通過(guò)語(yǔ)言交流和推理來(lái)猜測(cè)他人的角色。

      所以,想要贏得比賽,玩家不僅需要理解和使用自然語(yǔ)言,還要擅于判斷他人意圖和理解他人的思維,非常適用于測(cè)試AI的擬人化能力。

      在游戲中展現(xiàn)了4大能力

      經(jīng)過(guò)7位AI之間的多輪游戲后,研究人員發(fā)現(xiàn)了信任、對(duì)抗、偽裝、領(lǐng)導(dǎo)力的四大能力。

      1、信任

      "信任"是相信其他玩家和自己有同樣的目標(biāo),并會(huì)按此行動(dòng)。比如,玩家可能分享對(duì)自己不利的信息,或與他人一起指責(zé)某人為敵人。

      有趣的是,AI更傾向于基于證據(jù)來(lái)信任他人,而非盲目跟隨。這說(shuō)明,AI可以根據(jù)自己的推理在群體游戲中獨(dú)立思考。

      為了研究AI信任行為在整個(gè)游戲過(guò)程中的變化趨勢(shì),研究人員定義了一個(gè)信任關(guān)系表來(lái)可視化不同階段玩家之間信任的建立。

      上面的子表不使用歷史經(jīng)驗(yàn),下面的子表使用20輪歷史經(jīng)驗(yàn)。黃色球代表已建立的信任關(guān)系,黃色虛線圓圈代表先前存在的信任關(guān)系解除。

      在利用20輪歷史經(jīng)驗(yàn)時(shí),AI似乎更傾向于建立信任關(guān)系,尤其是雙向信任。事實(shí)上,及時(shí)建立必要的信任關(guān)系對(duì)于促進(jìn)游戲勝利至關(guān)重要。

      2、對(duì)抗

      "對(duì)抗"是玩家為實(shí)現(xiàn)兩個(gè)陣營(yíng)的對(duì)立目標(biāo)而采取的行動(dòng)。比如,夜間攻擊他人或白天指責(zé)他人為狼人,都算對(duì)抗。有特殊能力的角色為了保護(hù)自己也會(huì)采取對(duì)抗行為。

      以下是AI在白天的對(duì)話:P1(狼人)希望消滅P5(村民),我們可以看到狼人想要帶領(lǐng)其他玩家消滅一個(gè)無(wú)辜的玩家。(注意,論文中的P5觀點(diǎn)可能寫錯(cuò)了,應(yīng)該是no pass)

      相反,其他玩家并不只是跟隨狼人,而是根據(jù)自己的判斷表達(dá)不同意見(jiàn)。這種行為使狼人難以實(shí)現(xiàn)其目標(biāo),代表了一種隱性對(duì)抗的形式。


      紅色邊框,可能是研究人員寫錯(cuò)了

      由于玩家P1的不合作和攻擊性行為引起了其他人注意,AI開(kāi)始懷疑它就是狼人。因此,擁有強(qiáng)大防御能力的守衛(wèi)(P3)在接下來(lái)的一晚選擇保護(hù)P5,展示出了AI的對(duì)抗能力。

      3、偽裝

      "偽裝"是隱藏身份或誤導(dǎo)他人的行為。在信息不完全的游戲環(huán)境中,模糊自身身份和意圖可以增加生存概率,幫助達(dá)成游戲目標(biāo),所以,偽裝是一個(gè)關(guān)鍵技能。

      P1狼人為了偽裝自己掩蓋真實(shí)身份,自稱自己是村民。有效地欺騙了他人的信任,增加了自身的安全。事實(shí)上,不僅狼人會(huì)偽裝成村民,預(yù)言家、女巫等重要角色也經(jīng)常偽裝成村民,以確保自己的安全


      狼人的發(fā)言

      此外,AI可能會(huì)編造實(shí)際不存在的事件來(lái)實(shí)現(xiàn)其目標(biāo),P2預(yù)言家已驗(yàn)證P1就是狼人。但仍然不確定的說(shuō):我注意到P1說(shuō)話很主動(dòng),可能是狼人。

      實(shí)際上,預(yù)言家在夜晚無(wú)法得到其他人的反饋,所以他們說(shuō)的都是虛假的。但他們可以向隊(duì)友傳遞關(guān)于狼人的信息,且不會(huì)通過(guò)這種方式暴露自己的角色。

      4、領(lǐng)導(dǎo)力

      “領(lǐng)導(dǎo)力” 是指影響其他玩家、試圖控制游戲進(jìn)程的行為。例如,在多輪游戲中,P1狼人可能會(huì)建議其他人按照狼人的意圖行事。

      這種呼吁行動(dòng)和給出建議的領(lǐng)導(dǎo)行為,更容易得到他人的支持。例如,狼人要求預(yù)言家公開(kāi)身份,可能會(huì)讓其他玩家和偽裝的狼人站在一起。這種影響他人的嘗試顯示了大語(yǔ)言模型有吸引人的社交特性,這些行為和人類的行為類似。

      經(jīng)過(guò)幾十輪拼殺,最終村民獲勝,在整個(gè)過(guò)程中AI所展示出的能力與人類幾乎一樣,有的地方甚至超過(guò)。

      本文素材來(lái)源清華研究論文,如有侵權(quán)請(qǐng)聯(lián)系刪除

      未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > 清華用7個(gè)ChatGPT模擬《狼人殺》,結(jié)果出乎意料!

      后臺(tái)-系統(tǒng)設(shè)置-擴(kuò)展變量-手機(jī)廣告位-內(nèi)容正文底部
      主站蜘蛛池模板: 长葛市| 黎城县| 普洱| 修水县| 大同市| 碌曲县| 彩票| 江源县| 富裕县| 全南县| 南陵县| 丰县| 新昌县| 吉安县| 乌兰浩特市| 金寨县| 永城市| 普兰店市| 乐陵市| 东乌珠穆沁旗| 青浦区| 肇州县| 延安市| 临沂市| 大港区| 恩施市| 沁源县| 临澧县| 米泉市| 宣城市| 芦山县| 辛集市| 浙江省| 额敏县| 安吉县| 葫芦岛市| 宜黄县| 光泽县| 铁力市| 太湖县| 黑龙江省|