这个低调的国人团队,做出了完全由AI驱动的“开放世界”
ChatGPT的横空出世,放在各行各业的人眼中都是相当炸裂的。就像黄仁勋所说:“这是AI的iPhone时代”——AI带来的技术革命已经真实发生了。
而与AI互利共生的游戏行业,被认为将最先受到生成式AI的影响。不少游戏人和葡萄君聊到,他们很有可能会为产品接入GPT技术。即使现阶段,你也能看到一些雏形,比如接入了ChatGPT,可以和NPC自由对话、完成特别任务的《骑马与砍杀2》MOD。
再比如超参数科技公布的Demo《活的长安城》(下称长安城),可能是游戏圈最近最有代表性的应用案例。其背后的技术系统名叫GAEA,拥有构建一整套NPC生态的系统能力。在大家还埋头探索如何用AI技术提高研发效率的现阶段,GAEA可能是最先深入结合游戏性、改变游戏内容生态的一套解决方案,甚至有可能激发出下一代游戏的产品形态。
01
有身份、记忆,会唠嗑、恋爱的NPC们
在多数玩家印象中,NPC就应该是杵在一个固定位置,供你交易或完成任务的模型。但在长安城里,NPC们看起来“独立自主”,有自己的身份、经历,是会唠嗑、恋爱、处理日常事务的个体,和最近爆火的论文《Generative Agents: Interactive Simulacra of Human Behavior》里描述的一样,它们放佛是在虚拟场景中过日子。
为什么会有这种差异?简单来说,这是因为 NPC拥有自己的个性,会根据外部环境的反馈,和自身的目标、经历、状态来决定做什么。比如捕快的职责是维护治安,但成天巡街他也会累,当他失去耐心时,就会做出一些决策来调整状态,比如在路过茶馆时,溜进去喝喝茶。
虽然看起来,这种行为好像没什么特别的,但恰恰因为这符合我们日常生活中的逻辑,才显得 NPC们更像活生生的人。而当这种最常见的逻辑在游戏中被实现,那就是一件很了不起的事情了。
首先,NPC的拟人化行为并不是靠暴力堆if else,而是完全由GAEA系统来实现。超参数科技官方介绍,长安城中的 NPC都拥有灵魂系统,它是GAEA的子系统,由上下两层模型组成,上层具备常识理解能力,权衡长短期目标,能综合记忆能力做出驱动下层行为决策的宏观策略;下层则是通过符号系统建模的多任务模型,它依据上层的宏观策略,在微观层面制定具体的行为决策。此外,GAEA中还引入大语言模型来给NPC做规划和常识推理。
NPC的“记忆”,则会将上下两层串联起来,成为NPC有“生命”的关键,持续影响NPC往后的每一个决策。
这些NPC也并非一下子就变得像人,而是经历了一个学习的过程:首先依托于一个有足够多信息的训练场景——也就是长安城这样的开放世界,让NPC在其中通过环境交互来不断优化特征表达,逐渐学习到更复杂的策略和任务,在行为层面变得越来越合理。用较为正式的话来说,这件事叫训练Open-ended embodied agent,即具备复杂多任务能力的可交互AI。
而NPC和环境的交互,以及它们彼此之间的交互,才是长安城能鲜活起来的关键,也是真正能影响游戏内容生态的一环——如果NPC只是行为、语言像人,而不存在交互,即便人再多,这个虚拟世界仍然是死板的;但长安城里的NPC每时每刻都处于交互之中,就像一个不停运转的虚拟城市。
而且因为GAEA具备常识推理能力,受其系统框架影响的NPC都能做出顺应自身和身处虚拟场景逻辑的决策。
举个例子,酒楼的舞女因为和书生撞上,生气地和他吵架,但因为书生的内在属性决定了他处事温和,二人和解后舞女反而提升了对书生的好感度。此后他们再遇上,还会谈论起之前吵架的事,甚至一来二去、熟络起来之后,二人还谈起了恋爱。并且因为舞女天生浪漫数值高,她甚至会在自己想约会的时候翘班去见书生。
在NPC彼此都能交互的世界中,这只是一件很常见的小事。想象一下,当所有人的行为和决策相互交织,其中就会涌现出大量玩家无法预测的内容。俗话说“有人的地方就有江湖”,说的好像就是这种人情来往、宿命交织的感觉。这样看来,其实已经构成了一个简化的江湖概念,即便其中完全没有真人玩家的干预。
而在将来结合一些具体的游戏产品后,玩家也同样可以成为其中一员,与NPC们进行对话、交互,影响这个AI社会的变化。到那时,我们玩游戏的方式可能真的会被改变。
02
GAEA会如何影响游戏产品?
放眼行业来看,这确实是一种很新的技术。虽然目前或许还没人敢笃定玩家一定有这种需求,但结合当下游戏产品与AI技术的发展来看,葡萄君觉得有几点是值得关注的。
首先,它对游戏内容生态的影响,很可能形成产品之间的壁垒。超参数科技GAEA项目负责人张弛告诉葡萄君,目前的技术还做不到大众想象中完全实现开放,甚至NPC都有自主意识和无限制动作的那种游戏世界。但通过GAEA这样的技术系统,我们完全可以在内容方面实现“四两拨千斤”的效果。
以往的“千斤”是什么样大家可能都懂:最为成功的例子可能是《荒野大镖客2》,其中的NPC不同于传统游戏,有许多不同的故事线和细节,比如被你救助过的路人会在城镇里请你买东西。但其制作模式并没有本质上的变化——往往是通过写大量剧本、耗费大量人力堆内容,同时需要大量的人员去开发和维护,这也是游戏打磨了八年之久的原因之一。
而GAEA的“四两”,则是直接对NPC的内在目标进行建模,灵活运用大模型或强化学习的手段,在省去很多剧本编写细节的同时,提高交互内容的丰富度。
举个例子,目前的长安城看起来可能还不够完善——比如路人走路赚钱之类的设定有点草率,能做的事也就那么几种——当然,之所以草率是因为它只是个展现GAEA能力的Demo。但只要团队在底层多拆解出一些细致的行为和决策分支,NPC和长安城这类虚拟场景的整体丰富度就能大大增加。
你可以把这些底层分支理解为积木——有时只要多几块积木,我们就能搭出完全不一样的建筑。而放到MMO、开放世界或是元宇宙之类的产品中,这种能力就会让有限的内容爆发出极大的能量,甚至在内容上形成坚不可摧的壁垒。毕竟纯靠人力来堆内容本身就有一定门槛,而且势必卷不过AI,就像手工织布和纺织机的区别。
其次,从研发角度来看,不少项目都很需要一些工具来更好地编辑NPC,做到其行为可控的同时,又不会像传统行为树、状态机一样非常单一。如果要基于这种思路来开发一套AI工具,或许还需要从头招募技术人员、组建团队。
但张弛提到,通过GAEA这种能囊括部分工作流的解决方案,游戏产品几乎不需要改变原有生态,只需要提供可运行的模拟环境,经过部署就能做到“无缝接入”,并且还能根据不同产品的需求来定制行为,就像长安城那样。
另一方面,这种功能化、模块化的能力甚至可以提供给用户,让玩家直接使用各种以目标导向建模的深度学习模型来设计NPC的行为模式,进一步提高游戏的交互内容丰富程度。
最后,其他一些非MMO/开放世界形态的产品,也可能应用到这种技术。比如在互动直播类产品中,玩家可以以第一人称的方式影响剧情线路发展,做到以往产品做不到的沉浸感。
当然,即使现阶段已经有诸多设想,我们当下对AI可能带来的产品形态,仍然是一个“坐井观天”的状态,想象力非常有限。相信在将来这些设想真正落地后,AI还会引发出游戏行业更大的一场浪潮。
03
游戏与AI的未来,或许会从这里开始
目前看来,这套技术仍然需要持续探索,也需要实际和玩家见面来验证很多事情。但总体来说,在AI带来的技术革命之下,GAEA无疑是一个先行者——它可能会是市面上第一个,真正能对游戏性产生颠覆性影响的、完全由AI驱动的技术系统。
在未来几年内很有可能的一种情况是,两条路线会同时高速发展:
其一是AI与游戏研发结合,提高各个环节的研发效率、降本增效,甚至创造出完全不同的管线。
比如在策划部分帮助寻找灵感、生成各种形象描述、对话内容;在美术部分训练和生成Icon类资产,帮助调试画风、提高效率;还有在程序方面,葡萄君听许多技术朋友提到过,用GPT来协助编程已经是日常了。在将来,AI技术帮游戏行业实现“车库理论”完全是有可能的——只需要几个开发者,就能做出现阶段成本甚高的游戏。
其二则是AI与游戏性融合,对游戏内容和玩法造成巨大影响。
目前,即便游戏中接入大语言模型,游戏性往往也只是停留在自由对话的能力上,或者只在行为层有相当有限的交互。如果要真的以AI为核心拓展游戏性,就意味着必须从最底层做起,为所有的NPC或其他资源适配能力,甚至基于世界观建立一个全新的社会。
从这个角度来看,第二条路可能还要比第一条路更难走。但在这个技术发展按天迭代,真正日新月异的时代,我觉得这两个方向的成果都不会让我们等太久,而且还会非常惊艳。毕竟在以前,《西部世界》《头号玩家》那样的电影对我们来说还是天方夜谭,但现在……似乎也不是那么不可想象了。
- 0000
- 0001
- 0000
- 0009
- 0000