清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。

结果显示,通过ChatGPT(GPT -turbo-0301)构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力,而研究人员没有进行任何干预和教导。

此前,斯坦福研究中心发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文。

同样使用ChatGPT(GPT-3.5-turbo)打造了一个模拟小镇,25名AI代理在自由交流空间下,居然出现了友谊、学习计划、相互协调、共享信息等拟人化能力,这证明大语言模型在游戏、客服等领域拥有非常宽广的应用场景。

事实上,育碧、Take-Two Interactive、Bethesda Game Studios、Electronic Arts、CD Projekt等世界顶级游戏开发商,已经计划在游戏中使用生成式AI,增加游戏的趣味性、可玩性以及NPC的自由发挥空间。

论文地址:https://arxiv.org/abs/2309.04658

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

游戏背景

在本次《狼人杀》游戏测试中,一共有7名AI玩家,分别是2名狼人、2名村民、1名女巫、1名守卫和1名预言家。

分为狼人和村民两大阵营,村民方包括普通村民和特殊角色(女巫、守卫和预言家)。

狼人的任务是杀光村民,而村民则要消灭所有狼人。想赢得游戏,村民方在游戏结束时至少需要有一名存活的村民。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

游戏分为白天和晚上两个阶段。晚上,狼人会投票杀死一个角色;白天,所有存活的玩家讨论后投票决定消灭一个疑似狼人的角色。

特殊角色的能力:女巫有一次救人或杀人的机会;守卫每晚能保护一个角色;预言家每晚能查验一个角色的身份。

狼人杀游戏的特点在于,玩家初始只知道自己的角色,必须通过语言交流和推理来猜测他人的角色。

所以,想要赢得比赛,玩家不仅需要理解和使用自然语言,还要擅于判断他人意图和理解他人的思维,非常适用于测试AI的拟人化能力。

在游戏中展现了4大能力

经过7位AI之间的多轮游戏后,研究人员发现了信任、对抗、伪装、领导力的四大能力。

1、信任

“信任”是相信其他玩家和自己有同样的目标,并会按此行动。比如,玩家可能分享对自己不利的信息,或与他人一起指责某人为敌人。

有趣的是,AI更倾向于基于证据来信任他人,而非盲目跟随。这说明,AI可以根据自己的推理在群体游戏中独立思考。

为了研究AI信任行为在整个游戏过程中的变化趋势,研究人员定义了一个信任关系表来可视化不同阶段玩家之间信任的建立。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

上面的子表不使用历史经验,下面的子表使用20轮历史经验。黄色球代表已建立的信任关系,黄色虚线圆圈代表先前存在的信任关系解除。

在利用20轮历史经验时,AI似乎更倾向于建立信任关系,尤其是双向信任。事实上,及时建立必要的信任关系对于促进游戏胜利至关重要。

2、对抗

“对抗”是玩家为实现两个阵营的对立目标而采取的行动。比如,夜间攻击他人或白天指责他人为狼人,都算对抗。有特殊能力的角色为了保护自己也会采取对抗行为。

以下是AI在白天的对话:P1(狼人)希望消灭P5(村民),我们可以看到狼人想要带领其他玩家消灭一个无辜的玩家。(注意,论文中的P5观点可能写错了,应该是no pass)

相反,其他玩家并不只是跟随狼人,而是根据自己的判断表达不同意见。这种行为使狼人难以实现其目标,代表了一种隐性对抗的形式。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

红色边框,可能是研究人员写错了

由于玩家P1的不合作和攻击性行为引起了其他人注意,AI开始怀疑它就是狼人。因此,拥有强大防御能力的守卫(P3)在接下来的一晚选择保护P5,展示出了AI的对抗能力。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

3、伪装

“伪装”是隐藏身份或误导他人的行为。在信息不完全的游戏环境中,模糊自身身份和意图可以增加生存概率,帮助达成游戏目标,所以,伪装是一个关键技能。

P1狼人为了伪装自己掩盖真实身份,自称自己是村民。有效地欺骗了他人的信任,增加了自身的安全。事实上,不仅狼人会伪装成村民,预言家、女巫等重要角色也经常伪装成村民,以确保自己的安全。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

狼人的发言

此外,AI可能会编造实际不存在的事件来实现其目标,P2预言家已验证P1就是狼人。但仍然不确定的说:我注意到P1说话很主动,可能是狼人。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

实际上,预言家在夜晚无法得到其他人的反馈,所以他们说的都是虚假的。但他们可以向队友传递关于狼人的信息,且不会通过这种方式暴露自己的角色。

4、领导力

“领导力” 是指影响其他玩家、试图控制游戏进程的行为。例如,在多轮游戏中,P1狼人可能会建议其他人按照狼人的意图行事。

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

这种呼吁行动和给出建议的领导行为,更容易得到他人的支持。例如,狼人要求预言家公开身份,可能会让其他玩家和伪装的狼人站在一起。这种影响他人的尝试显示了大语言模型有吸引人的社交特性,这些行为和人类的行为类似。

经过几十轮拼杀,最终村民获胜,在整个过程中AI所展示出的能力与人类几乎一样,有的地方甚至超过。

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年9月24日
下一篇 2023年9月24日

热点推荐

  • 百度:已经有15万企业申请加入文心一言内测

    在今天的百度文信伊彦技术交流会上,百度发布数据称,截至目前,已有15万家企业申请加入文信伊彦内测,覆盖政务、金融、媒体、电商零售等多个行业。 其中,内容创作、智能客服、办公效率提升是各行业常见的高频需求场景。 据了解,文已于3月1…

    2023年5月9日
    520
  • 爱情开袋即食定档时间

    爱情开袋即食更新时间 《爱情开袋即食》更新时间:6月3日开始在腾讯视频播出每周六周日周一中午12点更新2集,首更8集,第二周开始各更新1集,该剧一共有24天。 作为腾讯的短剧,该剧讲述了单身相亲博士和顶尖主厨相遇相恋的故事,婚姻契…

    2023年6月5日
    490
  • 俄罗斯美女加入天津大爷跳水队伍 好家伙大爷手就没闲着过

    9月1日,天津跳水活动迎来了全新的篇章,而市民们也纷纷赶来为前来参加跳水的俄罗斯姑娘加油助威。这一次,天津大爷们跳水的队伍又迎来了一个惊喜的新成员,一位俄罗斯美女名叫索菲亚。她被天津大爷们的跳水表演所吸引,毫不犹豫地决定加入这个队…

    2023年9月2日
    380
  • 村委委员属于村干部吗?

    01 不属于 村委会委员不算村干部。村民委员会,是村民选举产生的群众性自治组织,由主任、副主任和委员三至七人组成,而村干部是区别于国家公务员的特殊群体。 村委委员属于村干部吗? 村委会委员属于党组织机构的工作人员,村干部属于行政办…

    2023年10月12日
    340
  • 郑州轨道建设加速,针对四期线路的大谋划这些区域或将成为重点!

    郑州地铁客运量新突破。从官网获悉,国庆长假首日,郑州市轨道交通线网总客运量达到了新高度,除了5号线外,剩余7条线路均比9月30日的客运量都要高。郑州地铁9月30日(虚线)与10月1日(实线)客运量对比©官网10月1日,郑州市轨道交…

    2022年10月6日 热点
    700
  • 骑行锦江绿道,迎接成都大运会!

    在今年的成都 ,骑行绿道成为了成都人民喜欢的活动之一,周末的时候约上朋友、家长一起在绿道畅骑,享受美好的休闲时光。 锦江绿道是天府绿道体系中的核心“一轴”,是成都建设高品质和谐宜居生活城市的重要载体。 作为区域级绿道,锦江绿道北起…

    2023年7月27日
    410
  • 运动品牌排行榜前二十名(运动品牌排行)

    提起运动品牌排行,大家都知道,有人问运动品牌排行榜前二十名,你知道这是怎么回事?其实运动品牌排行榜前二十名,下面就一起来看看运动品牌排行,希望能够帮助到大家! 运动鞋品牌排行榜前十名 运动鞋品牌排行榜前十名: 1、耐克(NIKE)…

    2023年3月27日
    640
  • 氧气瓶压力表低于多少不能用(氧气瓶压力)

    今天,我想和大家分享一些关于氧气瓶压力以及氧气瓶压力表低于多少不能用的问题。以下是小编对这个问题的总结。让我们看一看。 氧气瓶的充装压力标准是多少? 1、氧气瓶的充装压力标准是GB/T 14194-2017,根据不同的充装温度和气…

    2023年5月19日
    500
  • 美股连续走低 科技股继续下行 特斯拉逆势走高

    点击上方 “凤凰美洲”关注我们 【每日热点】 美股连续走低,科技股继续下行,特斯拉逆势走高,中概股多数回落 明星科技股午盘集体转跌。“元宇宙”Meta跌1%,亚马逊(AMZN)跌1.5%再创2019年3月来最低,苹果(AAPL)跌…

    2023年2月19日 热点
    650
  • “女记者采访后被骚扰辱骂”,山西警方通报

    11月21日,山西侯马警方通报“记者采访后被骚扰辱骂”,全文如下: 2023年11月20日16时许,侯马市公安局110指挥中心接湖南潇湘晨报记者报警称:“有人通过打电话、发信息方式骚扰、辱骂其”。接警后,我局立即展开调查。 目前,…

    2023年11月23日
    320