为了培养下一个 AlphaGo,暴雪想把《星际争霸 2》变成 AI 实验室

作者 | 发布日期 2017 年 08 月 10 日 20:26 | 分类 google , 人工智能 , 电子娱乐
StarCraft_Cover

「围棋上帝」AlphaGo 在战胜柯洁之后便宣布退役,成为围棋界难以逾越的一座高峰。而其缔造者 DeepMind 公司早就为人工智能准备了下一个目标:《星际争霸 2》(StarCraft)。



《星际争霸 2》是由暴雪娱乐(Blizzard Entertainment)在 2010 年推出的即时战略游戏,游戏剧情主要讲述了在遥远未来,一场围绕银河系中心的种族之战。由于游戏极其考验玩家对资源的运营策略,因此也被视为 AI 研究的突破点之一。

StarCraft_02

(《星际争霸 2》游戏画面,图片来源:YouTube

DeepMind 科学家奥利奥尔·温雅尔斯(Oriol Vinyals)就曾是顶级的《星际争霸》玩家之一,他曾提出这样一个观点

玩《星际争霸》的 AI 需要有效地利用记忆力,能够进行长期战略规划,并根据新的信息不断做出调整。如果我们开发的 AI 系统能掌握如此复杂多变的技能,那么最终这些技术也将被用于服务现实世界。

因此,早在 2016 年 11 月份,DeepMind 就宣布与暴雪娱乐合作,将针对《星际争霸 2》展开一系列的研究实验。而到了 2017 年 8 月 9 日,暴雪与 DeepMind 公开了这个项目的初步研究成果,将开放《星际争霸 2》作为 AI 研究环境。这个人工智能环境包将包括:

  • 在游戏中为开发者和研究员加入了人工智能 API,并且首次支持 Linux 环境
  • 新增一个匿名游戏回放数据库,并且在未来的几周里,游戏回放数据将从 65000 份增加到 50 万份
  • 加入 DeepMind 开源工具集 PySC2,让研究员可以轻松地调用暴雪底层的功能 API
  • 新增一系列的 RL 迷你游戏,从而让研究员能够测试 AI 在特定任务下的性能
  • ……

StarCraft_01-360x203

(《星际争霸 2》中训练 AI 的小游戏,图片来源:DeepMind

实际上,《星际争霸》游戏里一直都有不同难度的 AI 存在,只不过这些 AI 是通过访问游戏后台、采集全局数据来与玩家作斗争,玩家和 AI 一开始就不在同一条起跑线上。而 DeepMind 的最终目的,是训练一个能在同等条件下与人类进行竞争的 AI,这才是该项目最具挑战性的地方。

一些人类习以为常的动作,要让 AI 来做就得经过不断地训练。在接受 The Verge 采访时,DeepMind 科学家奥利奥尔举过这么一个例子:

在游戏中有一个名为「战争迷雾」的机制,黑雾笼罩了整个地图,玩家需要经过不断地探索才能找出敌人。因此,对于 AI 来说,它必须记住「我曾在这里见过某个单位,但现在这个单位不见了,所以我要回去侦查一下,看看附近有没有敌人的基地」。

对于人类选手来说,这是一个常识。但对于人工智能来说,这是一个值得学习的挑战。这是《星际争霸》与国际象棋最不同的地方,玩国际象棋的时候,双方的环境一目了然,但在《星际争霸》里,玩家无论何时都要了解自己周边的环境。

S1

(AI 眼中的《星际争霸 2》,图片来源:DeepMind

目前,人工智能对《星际争霸》的探索还处在非常早期的阶段,不仅需要训练各种「常识」,而且在面临突发情况时的应变能力也有所不足(AlphaGo 就曾经下棋下到崩溃)。这也就难怪 24 岁的顶级《星际争霸 2》电竞选手 Byun Hyun Woo 敢大放厥词了:

至少在我的有生之年,我不认为 AI 能够打败职业玩家。

AlphaGo 只用了一年就超越了柯洁,人工智能问鼎《星际争霸 2》世界冠军,要几年?

题图来源:YouTube

(本文由 爱范儿 授权转载;首图来源:DeepMind

延伸阅读:

如需获取更多资讯,请关注微信公众账号:Technews科技新报

爱范儿

爱范儿:Beats of bits //发现创新价值的科技媒体,MobileMonday 广州授权组织者。
未经许可,任何媒体、网站或个人不得复制、转载、或以其他方式使用本网站的内容,违者必究。

直接使用新浪微博发表评论

 

发表评论