面对最菜TI战队,OpenAI在Dota2上输的毫无还手之力
https://zhuanlan.zhihu.com/p/42747177
机器之心报导,作者:Tony Peng.
去年,OpenAI 的1v1 AI 击败了世界顶尖选手Dendi,OpenAI CTO Greg
Brockman 承诺:明年,我们会带着5v5 的AI bot 重回TI。今天,他们履行
了诺言,带着全新的OpenAI Five,意欲挑战全世界最顶尖的Dota 2 人类玩
家。然而,51 分钟的比赛之后,OpenAI 经历了一场完败。
据介绍,本届TI8 的很多参赛队伍都报名想参加与AI 的比赛,OpenAI 今天
遇到了第一个对手:来自巴西的战队paiN,后者也是本届TI8 比赛第一支被
淘汰的队伍。但不可否认,它仍然是目前为止全球最为强大的18 支队伍之
一。而在此之前的公开比赛中,OpenAI Five 在1v1 比赛中战胜了Dendi,
又在5v5 比赛中战胜了人类前职业玩家、游戏解说员组成的6000 分级别战
队。
有AlphaGo 围棋的“前车之鉴”,比赛之前,人们纷纷预测OpanAI 的人工
智能稳赢。然而事实并没有这么简单,虽然OpenAI 的智能体在操作反应等
方面比较有优势,当在整体策略与合作上仍比不上人类团队。
TI8,开局不利
今天的人机大战仅进行一场,比赛双方阵容如下:
OpenAI 天辉方:直升机、巫妖、死亡先知、冰女、潮汐
paiN 夜魇方:莱恩、死灵法师、巫医、火枪、斧王
比赛一开始,OpenAI 就给了自己97% 的胜率,然而开局就出师不利,paiN
选择了开雾直接冲进天辉野区,四人围攻落单的潮汐,抢到了一血。OpenAI
也展示出了人工智能“不聪明”的一面,在塔下不断插眼。
paiN 开局打的不错,游戏进入7 分半,OpenAI Five 落后1000 经济。
OpenAI 逐渐在10 分钟时把比分掰成了7 比7,场面陷入了焦灼。我们可以
看到,电脑并不注重杀人,只专注于推塔。随后,AI 在两拨下路团战中抓
住了机会。至17 分钟,OpenAI 的经济反超人类选手。
21 分半,AI 拿下Roshan,这也是AI 首次在公开比赛中击杀Roshan,直升
机拿盾。不过,在25 分钟直升机在夜魇野区被抓,盾被浪费了。AI 也没有
来救,直接抛弃大哥了。32 分钟第二次拿下Roshan,但是没想到的,
OpenAI 非常“自私”,谁杀掉了Roshan 谁拿走不朽盾,就算他是辅助位!
随后,OpenAI 下路野区打出一波二换四。
人工智能对于插眼的思路异于人类,我们最多可以看到三个真眼被放在了
Roshan 门口!而AI 同时还在家里也放了三个眼,引来了解说的吐槽。在满
级之后,我们看到了AI 死亡先知一直在大招收野区,很强!
paiN 的玩家虽然人头落后,在英雄操作上不占优势,但逐渐找回了节奏,
在推掉下路后占据了场面上的优势。35 分钟,人类玩家上了高地,此时
OpenAI 预测的胜率降低到了67%。
当然,人类并不认为此时AI 还能占据优势。在37 分钟,paiN 经济已经领
先了9000。到40 分钟,OpenAI 在击杀了人类两个英雄后选择了第三次打
Roshan,不过此时人类职业玩家似乎已经掌握了人工智能的套路。
比赛进行到第49 分钟,AI 认为自己的胜率已经降低到20%,大局已定。
最终,paiN 的人类玩家在团灭OpenAI 之后打爆了水晶。TI8 人机大战第一
场比赛以人类的胜利告于段落。
今天的比赛,AI 存在着三个巨大的问题:
首先,游戏中期不会Gank 也不会集中优势推塔了。在20 分钟到35 分钟的
时候,有一段空窗期,paiN 的火枪和斧王都还没有出BKB,这是AI 的好机
会。但是除了到处插眼,就是在Roshan 附近晃悠,也没有组织起像样的抓
人和推塔。等到敌方经济打出来,BKB 出来之后,比赛呈现了一边倒的态
势。
其次,没有位置之分,不会合理安排资源。Dota 历来有1-5 号位,1 号位
Carry,4-5 号位辅助。将最优资源分配给1 号位是Dota 多年来的经验,本
场比赛paiN 也是将资源优先分配给火枪和斧王。反观AI 这边,遵守着人人
平等的原则,竟然出现了让潮汐和巫妖拿不朽盾这种“战术安排”。
最后,出装出现大的问题。AI 似乎不明白什么装备合适,而且浪费了大量
的金钱在插眼上。
OpenAI Five 项目组成员、研究科学家Jonathan Raiman 告诉机器之心,团
队成员并没有特别失望,“赛前,我们大多数人觉得赢下本场比赛的机率大
概就30%-40%。这场比赛我们学到了很多东西,比如AI 击杀了Roshan 很多
次,这些都值得我们回去好好研究。”
Raiman 透露,此次比赛环境因为改变信鸽的设置,信鸽变得可以被击杀,
这让模型又要重新适应新的环境,一定程度上影响了很多因素,比如装备的
购买;此外,团队正在反思关于未来奖励权重的设置。OpenAI 有一套团队
协作机制(后文会详细介绍),一切奖励都围绕游戏最终胜利为前提,但现
在看来,这样的设置降低了AI 在前期farm 和积累经济的积极性。
这只是OpenAI 在TI8 期间的第一场比赛,之后还有两场比赛留给OpenAI 挽
尊。只不过,从6 月首次公开OpenAI Five 研究成果,到一路顺风顺水地在
基准测试中虐杀人类队伍,OpenAI Five 为何在今日遭受当头棒喝,或许,
我们可以从它之前的故事里,得到一些启示。
(中间描述OpenAI之前为何选择Dota2以及目前成果的部分跳过)
但无论如何,OpenAI 实现了在非完美的环境里实现了复杂协作和长期游戏
操作,这已经是巨大的突破了。尽管OpenAI 并没有自主开发出具有突破性
的算法,但他们将现有的最前沿的算法和模型和算力相结合,让一个智能体
从什么都不会、通过自我对抗和学习、发展出一套合理的行为模式,这种方
法在其他的AI 应用、机器人和游戏里都将可能被应用。
TI8 不是OpenAI Five 的最后一站,他们还会举办最后一场比赛,时间未
定,预计在10-11 月,甚至有可能在明年年初。届时,OpenAI 希望可以开
放英雄池里所有的英雄,放开所有限制,让AI 和人类玩家真正打一局酣畅
淋漓的Dota 2 比赛。
从现在来看,OpenAI 的Dota 之旅,还远远没有结束。