[情报] 面对最菜TI战队,OpenAI毫无还手之力

楼主: Jotarun (forever)   2018-08-23 22:58:40
面对最菜TI战队,OpenAI在Dota2上输的毫无还手之力
https://zhuanlan.zhihu.com/p/42747177
机器之心报导,作者:Tony Peng.
去年,OpenAI 的1v1 AI 击败了世界顶尖选手Dendi,OpenAI CTO Greg
Brockman 承诺:明年,我们会带着5v5 的AI bot 重回TI。今天,他们履行
了诺言,带着全新的OpenAI Five,意欲挑战全世界最顶尖的Dota 2 人类玩
家。然而,51 分钟的比赛之后,OpenAI 经历了一场完败。
据介绍,本届TI8 的很多参赛队伍都报名想参加与AI 的比赛,OpenAI 今天
遇到了第一个对手:来自巴西的战队paiN,后者也是本届TI8 比赛第一支被
淘汰的队伍。但不可否认,它仍然是目前为止全球最为强大的18 支队伍之
一。而在此之前的公开比赛中,OpenAI Five 在1v1 比赛中战胜了Dendi,
又在5v5 比赛中战胜了人类前职业玩家、游戏解说员组成的6000 分级别战
队。
有AlphaGo 围棋的“前车之鉴”,比赛之前,人们纷纷预测OpanAI 的人工
智能稳赢。然而事实并没有这么简单,虽然OpenAI 的智能体在操作反应等
方面比较有优势,当在整体策略与合作上仍比不上人类团队。
TI8,开局不利
今天的人机大战仅进行一场,比赛双方阵容如下:
OpenAI 天辉方:直升机、巫妖、死亡先知、冰女、潮汐
paiN 夜魇方:莱恩、死灵法师、巫医、火枪、斧王
比赛一开始,OpenAI 就给了自己97% 的胜率,然而开局就出师不利,paiN
选择了开雾直接冲进天辉野区,四人围攻落单的潮汐,抢到了一血。OpenAI
也展示出了人工智能“不聪明”的一面,在塔下不断插眼。
paiN 开局打的不错,游戏进入7 分半,OpenAI Five 落后1000 经济。
OpenAI 逐渐在10 分钟时把比分掰成了7 比7,场面陷入了焦灼。我们可以
看到,电脑并不注重杀人,只专注于推塔。随后,AI 在两拨下路团战中抓
住了机会。至17 分钟,OpenAI 的经济反超人类选手。
21 分半,AI 拿下Roshan,这也是AI 首次在公开比赛中击杀Roshan,直升
机拿盾。不过,在25 分钟直升机在夜魇野区被抓,盾被浪费了。AI 也没有
来救,直接抛弃大哥了。32 分钟第二次拿下Roshan,但是没想到的,
OpenAI 非常“自私”,谁杀掉了Roshan 谁拿走不朽盾,就算他是辅助位!
随后,OpenAI 下路野区打出一波二换四。
人工智能对于插眼的思路异于人类,我们最多可以看到三个真眼被放在了
Roshan 门口!而AI 同时还在家里也放了三个眼,引来了解说的吐槽。在满
级之后,我们看到了AI 死亡先知一直在大招收野区,很强!
paiN 的玩家虽然人头落后,在英雄操作上不占优势,但逐渐找回了节奏,
在推掉下路后占据了场面上的优势。35 分钟,人类玩家上了高地,此时
OpenAI 预测的胜率降低到了67%。
当然,人类并不认为此时AI 还能占据优势。在37 分钟,paiN 经济已经领
先了9000。到40 分钟,OpenAI 在击杀了人类两个英雄后选择了第三次打
Roshan,不过此时人类职业玩家似乎已经掌握了人工智能的套路。
比赛进行到第49 分钟,AI 认为自己的胜率已经降低到20%,大局已定。
最终,paiN 的人类玩家在团灭OpenAI 之后打爆了水晶。TI8 人机大战第一
场比赛以人类的胜利告于段落。
今天的比赛,AI 存在着三个巨大的问题:
首先,游戏中期不会Gank 也不会集中优势推塔了。在20 分钟到35 分钟的
时候,有一段空窗期,paiN 的火枪和斧王都还没有出BKB,这是AI 的好机
会。但是除了到处插眼,就是在Roshan 附近晃悠,也没有组织起像样的抓
人和推塔。等到敌方经济打出来,BKB 出来之后,比赛呈现了一边倒的态
势。
其次,没有位置之分,不会合理安排资源。Dota 历来有1-5 号位,1 号位
Carry,4-5 号位辅助。将最优资源分配给1 号位是Dota 多年来的经验,本
场比赛paiN 也是将资源优先分配给火枪和斧王。反观AI 这边,遵守着人人
平等的原则,竟然出现了让潮汐和巫妖拿不朽盾这种“战术安排”。
最后,出装出现大的问题。AI 似乎不明白什么装备合适,而且浪费了大量
的金钱在插眼上。
OpenAI Five 项目组成员、研究科学家Jonathan Raiman 告诉机器之心,团
队成员并没有特别失望,“赛前,我们大多数人觉得赢下本场比赛的机率大
概就30%-40%。这场比赛我们学到了很多东西,比如AI 击杀了Roshan 很多
次,这些都值得我们回去好好研究。”
Raiman 透露,此次比赛环境因为改变信鸽的设置,信鸽变得可以被击杀,
这让模型又要重新适应新的环境,一定程度上影响了很多因素,比如装备的
购买;此外,团队正在反思关于未来奖励权重的设置。OpenAI 有一套团队
协作机制(后文会详细介绍),一切奖励都围绕游戏最终胜利为前提,但现
在看来,这样的设置降低了AI 在前期farm 和积累经济的积极性。
这只是OpenAI 在TI8 期间的第一场比赛,之后还有两场比赛留给OpenAI 挽
尊。只不过,从6 月首次公开OpenAI Five 研究成果,到一路顺风顺水地在
基准测试中虐杀人类队伍,OpenAI Five 为何在今日遭受当头棒喝,或许,
我们可以从它之前的故事里,得到一些启示。
(中间描述OpenAI之前为何选择Dota2以及目前成果的部分跳过)
但无论如何,OpenAI 实现了在非完美的环境里实现了复杂协作和长期游戏
操作,这已经是巨大的突破了。尽管OpenAI 并没有自主开发出具有突破性
的算法,但他们将现有的最前沿的算法和模型和算力相结合,让一个智能体
从什么都不会、通过自我对抗和学习、发展出一套合理的行为模式,这种方
法在其他的AI 应用、机器人和游戏里都将可能被应用。
TI8 不是OpenAI Five 的最后一站,他们还会举办最后一场比赛,时间未
定,预计在10-11 月,甚至有可能在明年年初。届时,OpenAI 希望可以开
放英雄池里所有的英雄,放开所有限制,让AI 和人类玩家真正打一局酣畅
淋漓的Dota 2 比赛。
从现在来看,OpenAI 的Dota 之旅,还远远没有结束。
作者: aleks (aleks)   2018-08-23 23:08:00
Denti..
作者: abtvctkto61 (大魔王)   2018-08-23 23:15:00
denti
作者: oichi (calamity)   2018-08-23 23:52:00
记得修错字啊....
作者: aaronshell (那就是排骨酥汤啊)   2018-08-24 00:09:00
囧太郎怎么都知道
作者: xdanielzero (海陆两用体育长宵夜型态)   2018-08-24 00:32:00
囧太郎生意做到Dota2上了喔XD
楼主: Jotarun (forever)   2018-08-24 01:00:00
OpenAi而已 dota2实在好难...
作者: lililu25 (哩哩噜)   2018-08-24 02:31:00
我上场还是被OpenAI屌虐吧...
作者: syldsk (Iluvia)   2018-08-24 05:42:00
w33斧王吼不到人超屌哈哈
作者: z83420123 (VoLTsRiNe)   2018-08-24 06:46:00
不是有偷接api了 还打输
作者: Twopoint2 (2.2)   2018-08-24 08:16:00
前一篇才说AI作弊不公平 结果AI输了 XDD
作者: syldsk (Iluvia)   2018-08-24 08:23:00
哪篇写超烂,连宏都不会翻译
作者: remmurds (Stronghold)   2018-08-24 09:50:00
不就科技橘报那篇?脸被打得好肿
作者: koexe (独酌)   2018-08-24 10:02:00
w33每次跳进去就被吹起来 队友狂笑
作者: kennyboy918 (茶叶蛋)   2018-08-24 15:48:00
刚看到囧太郎 还切出去先一下484跑错版XD
作者: kunkka (aMao)   2018-08-24 19:08:00
AI虽然输职业,但API这点我认为指责是有道理的直接读取数据与人类用眼睛看到图像然后才分析与判断是孑然不同的东西单以反应来说,为何团队宣称ai调到跟人类反应速度差不多,但实际赛场上为何还是快的不可思议?
作者: koexe (独酌)   2018-08-24 19:12:00
斧王跳吼 连吼的前摇动作都没出来就飞起来囉
作者: kunkka (aMao)   2018-08-24 19:13:00
1是人类不可能无时无刻都处在全神紧绷的绝佳状态2是人类脑袋其实是先分析看到的影像是什么,然后才思考怎么做,这是和直接读后台资料最不一样的地方
作者: syldsk (Iluvia)   2018-08-24 19:18:00
职业选手,五次有一次跳走就很神奇了
楼主: Jotarun (forever)   2018-08-24 22:58:00
电脑不会分心 200ms反应就一定是200ms啊但这个比赛重点一直都不在于打赢 而是在比赛过程现在用API只是因为这样可以限缩问题 因为要解的问题太多
作者: mrmowmow (mow)   2018-08-24 23:31:00
在装啦,到时候正式比赛再赢作新闻,剧本都写好的
作者: silentlich   2018-08-25 08:27:00
用api没什么好说的 图片分析根本不耗CPU 现在这样弄只是省钱而已 要弄也是另外雇没ai专业的人来弄你钱多还可以再雇一群写机械手控制的 但都跟ai无关
作者: hanmas   2018-08-25 08:51:00
api有两个问题 第一是不受摄影机范围限制 人类一直切屏很吃操作 第二是不受鼠标移动速度限制 所以人类跳不走ai跳的走因为人类看到了 鼠标来不及滑走
作者: peter506g (一氧化二氢)   2018-08-25 11:42:00
推个 研究人员之前也有提到 禁止幻象跟召唤物也是为了不要让电脑有太大操作优势 而不是电脑不会控
作者: hanmas   2018-08-25 12:16:00
我觉得ai明显不受摄影机限制 不然五只合作不会这么好 说视野一样是说他们没开图 但是能看到的他们不用切屏都知道
作者: henry1234562 (亨利二十三)   2018-08-25 17:27:00
禁止召唤物跟幻像 是AI不会对应的问题不是不会控 AI还没有训练区分幻象
楼主: Jotarun (forever)   2018-08-26 10:14:00
还没有的原因就是还没找到好的方式训练反正挑战还很多 不要看alphago好像很快就变很强围棋毕竟每回合能做的事简单很多 而且早已经被研究很久了
作者: hanmas   2018-08-26 13:06:00
那篇根本没说ai要切屏 反而有说视野从api来基本上证明我说的是对的 我不认为api有管摄影机
作者: henry1234562 (亨利二十三)   2018-08-27 08:32:00
我觉得啦 不要假设一堆团队没说明的事情
作者: hanmas   2018-08-27 13:21:00
前一句不就说api feature了 set of features that human can see这么模棱两可的话你也信 XD 我不切屏 你人类要切屏才看的到不是也human can see
作者: henry1234562 (亨利二十三)   2018-08-27 13:28:00
那就不用讨论啦 开发团队的说明你不信还讨论啥都给你脑补不就好了 不就好有道理不管解释啥都说不可信就好啦 多方便 你就是作弊啦到底ai是他们开发团队设计的还是你设计的?
作者: hanmas   2018-08-27 14:36:00
我不是说他们说谎 是他们用模糊的话唬隆人然后你脑补了
楼主: Jotarun (forever)   2018-08-27 14:38:00
反正根本没打赢 也不用说啥作弊XD
作者: henry1234562 (亨利二十三)   2018-08-27 14:41:00
我觉得 说别人讲的模糊比较像脑补都明确说了是near hero 也说了只能观察到部分还是说要写份报表详细说明看得到多少才不模糊呢?
作者: hanmas   2018-08-27 15:55:00
英雄视野最多就1800 只给你看视野有的就是near your hero还是不用切屏 你反过来想 他用的是其他bot也用的api openai 机器学习可能可以学会切屏 普通bot有可能吗
作者: henry1234562 (亨利二十三)   2018-08-27 16:25:00
哪里有说他用的是其他bot也用的api?我以为如果是那样 他直接说same as不就好了?喔 我看了 那确实没错 除非他们另外做设定限制

Links booklink

Contact Us: admin [ a t ] ucptt.com