[情报] 面对最菜TI战队，OpenAI毫无还手之力 Jotarun PTT批踢踢实业坊

[情报] 面对最菜TI战队，OpenAI毫无还手之力

楼主: Jotarun (forever) 2018-08-23 22:58:40

面对最菜TI战队，OpenAI在Dota2上输的毫无还手之力
https://zhuanlan.zhihu.com/p/42747177
机器之心报导，作者：Tony Peng.
去年，OpenAI 的1v1 AI 击败了世界顶尖选手Dendi，OpenAI CTO Greg
Brockman 承诺：明年，我们会带着5v5 的AI bot 重回TI。今天，他们履行
了诺言，带着全新的OpenAI Five，意欲挑战全世界最顶尖的Dota 2 人类玩
家。然而，51 分钟的比赛之后，OpenAI 经历了一场完败。
据介绍，本届TI8 的很多参赛队伍都报名想参加与AI 的比赛，OpenAI 今天
遇到了第一个对手：来自巴西的战队paiN，后者也是本届TI8 比赛第一支被
淘汰的队伍。但不可否认，它仍然是目前为止全球最为强大的18 支队伍之
一。而在此之前的公开比赛中，OpenAI Five 在1v1 比赛中战胜了Dendi，
又在5v5 比赛中战胜了人类前职业玩家、游戏解说员组成的6000 分级别战
队。
有AlphaGo 围棋的“前车之鉴”，比赛之前，人们纷纷预测OpanAI 的人工
智能稳赢。然而事实并没有这么简单，虽然OpenAI 的智能体在操作反应等
方面比较有优势，当在整体策略与合作上仍比不上人类团队。
TI8，开局不利
今天的人机大战仅进行一场，比赛双方阵容如下：
OpenAI 天辉方：直升机、巫妖、死亡先知、冰女、潮汐
paiN 夜魇方：莱恩、死灵法师、巫医、火枪、斧王
比赛一开始，OpenAI 就给了自己97% 的胜率，然而开局就出师不利，paiN
选择了开雾直接冲进天辉野区，四人围攻落单的潮汐，抢到了一血。OpenAI
也展示出了人工智能“不聪明”的一面，在塔下不断插眼。
paiN 开局打的不错，游戏进入7 分半，OpenAI Five 落后1000 经济。
OpenAI 逐渐在10 分钟时把比分掰成了7 比7，场面陷入了焦灼。我们可以
看到，电脑并不注重杀人，只专注于推塔。随后，AI 在两拨下路团战中抓
住了机会。至17 分钟，OpenAI 的经济反超人类选手。
21 分半，AI 拿下Roshan，这也是AI 首次在公开比赛中击杀Roshan，直升
机拿盾。不过，在25 分钟直升机在夜魇野区被抓，盾被浪费了。AI 也没有
来救，直接抛弃大哥了。32 分钟第二次拿下Roshan，但是没想到的，
OpenAI 非常“自私”，谁杀掉了Roshan 谁拿走不朽盾，就算他是辅助位！
随后，OpenAI 下路野区打出一波二换四。
人工智能对于插眼的思路异于人类，我们最多可以看到三个真眼被放在了
Roshan 门口！而AI 同时还在家里也放了三个眼，引来了解说的吐槽。在满
级之后，我们看到了AI 死亡先知一直在大招收野区，很强！
paiN 的玩家虽然人头落后，在英雄操作上不占优势，但逐渐找回了节奏，
在推掉下路后占据了场面上的优势。35 分钟，人类玩家上了高地，此时
OpenAI 预测的胜率降低到了67%。
当然，人类并不认为此时AI 还能占据优势。在37 分钟，paiN 经济已经领
先了9000。到40 分钟，OpenAI 在击杀了人类两个英雄后选择了第三次打
Roshan，不过此时人类职业玩家似乎已经掌握了人工智能的套路。
比赛进行到第49 分钟，AI 认为自己的胜率已经降低到20%，大局已定。
最终，paiN 的人类玩家在团灭OpenAI 之后打爆了水晶。TI8 人机大战第一
场比赛以人类的胜利告于段落。
今天的比赛，AI 存在着三个巨大的问题：
首先，游戏中期不会Gank 也不会集中优势推塔了。在20 分钟到35 分钟的
时候，有一段空窗期，paiN 的火枪和斧王都还没有出BKB，这是AI 的好机
会。但是除了到处插眼，就是在Roshan 附近晃悠，也没有组织起像样的抓
人和推塔。等到敌方经济打出来，BKB 出来之后，比赛呈现了一边倒的态
势。
其次，没有位置之分，不会合理安排资源。Dota 历来有1-5 号位，1 号位
Carry，4-5 号位辅助。将最优资源分配给1 号位是Dota 多年来的经验，本
场比赛paiN 也是将资源优先分配给火枪和斧王。反观AI 这边，遵守着人人
平等的原则，竟然出现了让潮汐和巫妖拿不朽盾这种“战术安排”。
最后，出装出现大的问题。AI 似乎不明白什么装备合适，而且浪费了大量
的金钱在插眼上。
OpenAI Five 项目组成员、研究科学家Jonathan Raiman 告诉机器之心，团
队成员并没有特别失望，“赛前，我们大多数人觉得赢下本场比赛的机率大
概就30%-40%。这场比赛我们学到了很多东西，比如AI 击杀了Roshan 很多
次，这些都值得我们回去好好研究。”
Raiman 透露，此次比赛环境因为改变信鸽的设置，信鸽变得可以被击杀，
这让模型又要重新适应新的环境，一定程度上影响了很多因素，比如装备的
购买；此外，团队正在反思关于未来奖励权重的设置。OpenAI 有一套团队
协作机制（后文会详细介绍），一切奖励都围绕游戏最终胜利为前提，但现
在看来，这样的设置降低了AI 在前期farm 和积累经济的积极性。
这只是OpenAI 在TI8 期间的第一场比赛，之后还有两场比赛留给OpenAI 挽
尊。只不过，从6 月首次公开OpenAI Five 研究成果，到一路顺风顺水地在
基准测试中虐杀人类队伍，OpenAI Five 为何在今日遭受当头棒喝，或许，
我们可以从它之前的故事里，得到一些启示。
(中间描述OpenAI之前为何选择Dota2以及目前成果的部分跳过)
但无论如何，OpenAI 实现了在非完美的环境里实现了复杂协作和长期游戏
操作，这已经是巨大的突破了。尽管OpenAI 并没有自主开发出具有突破性
的算法，但他们将现有的最前沿的算法和模型和算力相结合，让一个智能体
从什么都不会、通过自我对抗和学习、发展出一套合理的行为模式，这种方
法在其他的AI 应用、机器人和游戏里都将可能被应用。
TI8 不是OpenAI Five 的最后一站，他们还会举办最后一场比赛，时间未
定，预计在10-11 月，甚至有可能在明年年初。届时，OpenAI 希望可以开
放英雄池里所有的英雄，放开所有限制，让AI 和人类玩家真正打一局酣畅
淋漓的Dota 2 比赛。
从现在来看，OpenAI 的Dota 之旅，还远远没有结束。

作者: aleks (aleks) 2018-08-23 23:08:00

Denti..

作者: abtvctkto61 (大魔王) 2018-08-23 23:15:00

denti

作者: oichi (calamity) 2018-08-23 23:52:00

记得修错字啊....

作者: aaronshell (那就是排骨酥汤啊) 2018-08-24 00:09:00

囧太郎怎么都知道

作者: xdanielzero (海陆两用体育长宵夜型态) 2018-08-24 00:32:00

囧太郎生意做到Dota2上了喔XD

楼主: Jotarun (forever) 2018-08-24 01:00:00

OpenAi而已 dota2实在好难...

作者: lililu25 (哩哩噜) 2018-08-24 02:31:00

我上场还是被OpenAI屌虐吧...

作者: syldsk (Iluvia) 2018-08-24 05:42:00

w33斧王吼不到人超屌哈哈

作者: z83420123 (VoLTsRiNe) 2018-08-24 06:46:00

不是有偷接api了还打输

作者: Twopoint2 (2.2) 2018-08-24 08:16:00

前一篇才说AI作弊不公平结果AI输了 XDD

作者: syldsk (Iluvia) 2018-08-24 08:23:00

哪篇写超烂，连宏都不会翻译

作者: remmurds (Stronghold) 2018-08-24 09:50:00

不就科技橘报那篇？脸被打得好肿

作者: koexe (独酌) 2018-08-24 10:02:00

w33每次跳进去就被吹起来队友狂笑

作者: kennyboy918 (茶叶蛋) 2018-08-24 15:48:00

刚看到囧太郎还切出去先一下484跑错版XD

作者: kunkka (aMao) 2018-08-24 19:08:00

AI虽然输职业，但API这点我认为指责是有道理的直接读取数据与人类用眼睛看到图像然后才分析与判断是孑然不同的东西单以反应来说，为何团队宣称ai调到跟人类反应速度差不多，但实际赛场上为何还是快的不可思议？

作者: koexe (独酌) 2018-08-24 19:12:00

斧王跳吼连吼的前摇动作都没出来就飞起来囉

作者: kunkka (aMao) 2018-08-24 19:13:00

1是人类不可能无时无刻都处在全神紧绷的绝佳状态2是人类脑袋其实是先分析看到的影像是什么，然后才思考怎么做，这是和直接读后台资料最不一样的地方

作者: syldsk (Iluvia) 2018-08-24 19:18:00

职业选手，五次有一次跳走就很神奇了

楼主: Jotarun (forever) 2018-08-24 22:58:00

电脑不会分心 200ms反应就一定是200ms啊但这个比赛重点一直都不在于打赢而是在比赛过程现在用API只是因为这样可以限缩问题因为要解的问题太多

作者: mrmowmow (mow) 2018-08-24 23:31:00

在装啦，到时候正式比赛再赢作新闻，剧本都写好的

作者: silentlich 2018-08-25 08:27:00

用api没什么好说的图片分析根本不耗CPU 现在这样弄只是省钱而已要弄也是另外雇没ai专业的人来弄你钱多还可以再雇一群写机械手控制的但都跟ai无关

作者: hanmas 2018-08-25 08:51:00

api有两个问题第一是不受摄影机范围限制人类一直切屏很吃操作第二是不受鼠标移动速度限制所以人类跳不走ai跳的走因为人类看到了鼠标来不及滑走

作者: peter506g (一氧化二氢) 2018-08-25 11:42:00

推个研究人员之前也有提到禁止幻象跟召唤物也是为了不要让电脑有太大操作优势而不是电脑不会控

作者: hanmas 2018-08-25 12:16:00

我觉得ai明显不受摄影机限制不然五只合作不会这么好说视野一样是说他们没开图但是能看到的他们不用切屏都知道

作者: henry1234562 (äº¨åˆ©äºŒåä¸‰) 2018-08-25 17:27:00

禁止召唤物跟幻像是AI不会对应的问题不是不会控 AI还没有训练区分幻象

楼主: Jotarun (forever) 2018-08-26 10:14:00

还没有的原因就是还没找到好的方式训练反正挑战还很多不要看alphago好像很快就变很强围棋毕竟每回合能做的事简单很多而且早已经被研究很久了

作者: hanmas 2018-08-26 13:06:00

那篇根本没说ai要切屏反而有说视野从api来基本上证明我说的是对的我不认为api有管摄影机

我觉得啦不要假设一堆团队没说明的事情

作者: hanmas 2018-08-27 13:21:00

前一句不就说api feature了 set of features that human can see这么模棱两可的话你也信 XD 我不切屏你人类要切屏才看的到不是也human can see

那就不用讨论啦开发团队的说明你不信还讨论啥都给你脑补不就好了不就好有道理不管解释啥都说不可信就好啦多方便你就是作弊啦到底ai是他们开发团队设计的还是你设计的?

作者: hanmas 2018-08-27 14:36:00

我不是说他们说谎是他们用模糊的话唬隆人然后你脑补了

楼主: Jotarun (forever) 2018-08-27 14:38:00

反正根本没打赢也不用说啥作弊XD

我觉得说别人讲的模糊比较像脑补都明确说了是near hero 也说了只能观察到部分还是说要写份报表详细说明看得到多少才不模糊呢?

作者: hanmas 2018-08-27 15:55:00

英雄视野最多就1800 只给你看视野有的就是near your hero还是不用切屏你反过来想他用的是其他bot也用的api openai 机器学习可能可以学会切屏普通bot有可能吗

哪里有说他用的是其他bot也用的api?我以为如果是那样他直接说same as不就好了?喔我看了那确实没错除非他们另外做设定限制

继续阅读

Re: [赛事] TI 梦幻挑战玩法以及作业24日主赛事sdakl [赛事] The International 8 正规赛 D3oichi Re: [赛事] TI 梦幻挑战玩法以及作业21日主赛事sdakl [情报] GABE新语音包免费送给有买本子的hi9060604 [赛事]The International 8 正规赛 D2oichi [问题] Steam登入的帐号被和谐youcan1030 Re: [赛事] TI 梦幻挑战玩法以及作业21日主赛事sdakl [讨论] TI8 delay30分GeForceRTX [赛事] The International 8 正规赛 D1oichi Re: [赛事] TI 梦幻挑战玩法以及作业20日主赛事sdakl