Re: [新闻] AI玩Dota2可以战胜半职业战队 专家:作弊

楼主: ohmylove347 (米特巴爾)   2018-08-20 04:28:15
※ 引述《madeinheaven ()》之铭言:
: AI玩《Dota2》可以战胜半职业战队》专家:存在作弊行为
: http://news.17173.com/content/08192018/214546321.shtml
: 【17173新闻报导,转载请注明出处】
: OpenAI是一家在2015年由马斯克等诸多硅谷大亨联合建立的AI非营利组织。前不久,他们
: 曾组织OpenAI Five和一支由半职业高手组成的战队进行了一场DOTA2比赛,结果直下两盘
: 轻松获胜,也让大家惊呼AI的无限可能。
: 然而近日,一些外国专家却指出这场胜利并不光彩,因为AI方存在作弊行为。因为OpenAI
: 直接通过API接口读取比赛数据来进行反馈和操作,由于是完全即时的数据,相比起先看
: 到游戏画面再反应的人类来说,确实是属于作弊行为。
: 此前DeepMind开发的一款AI也曾进行过《星际争霸2》的训练,不过由于是通过视觉识别
: 来进行操作,所以这款AI最终连简单电脑都打不过。看来,AI对竞技游戏的攻略还得再花
: 些时间了。
:
作者: Minesweeper (lleh)   2018-08-20 04:34:00
为什么连走都有困难就要先学飞了...呢
作者: fearman5566 (没)   2018-08-20 04:39:00
Google的作法才是学走路啊
作者: Minesweeper (lleh)   2018-08-20 04:43:00
无法理解视觉化的关键意义在哪
作者: hollowland (顛倒鐘)   2018-08-20 04:48:00
就啥怪怪的东西都可以套这样
作者: LF2Jeff (LF2-豆腐)   2018-08-20 04:57:00
如果你做了一个机器人,你觉得他学SC时靠头牵一条线读数据和用电子眼睛看新手教学来学,哪个算是比较成功的AI?
作者: Minesweeper (lleh)   2018-08-20 04:59:00
我会觉得先做出来打赢人类再说,因为我觉得现阶段就算给你读数据好了,一样打不赢
作者: arrenwu (键盘的战鬼)   2018-08-20 05:00:00
Clarify一下,AI的学习还是使用人类定义的好坏你的意思比较像是不屈就于人类觉得好的战术
作者: backzerg (Blackzerg)   2018-08-20 05:05:00
重点不是打赢 是像人类一样的学习模式不是什么都让人类输入资料 而是电脑主动去看 去学
作者: hollowland (顛倒鐘)   2018-08-20 05:10:00
mine的说法是告诉AI怎么用火 但是以现在的模式这个AI最后就只会用火其他什么都不会google是想要让AI靠自己摸索知道怎么用火最后就可以靠着这个自己摸索的流程会其他的东西
作者: Minesweeper (lleh)   2018-08-20 05:15:00
也就是说要建立学习典范,然后拿星海简化情况
作者: angel2210 (至死不渝)   2018-08-20 05:17:00
星海的情况其实有点复杂吧xd
作者: backzerg (Blackzerg)   2018-08-20 05:19:00
是啊 未知情报很多 状况也复杂多变 还有很长的路要走但只要成功了 距离萌萌机娘萝莉的诞生又更近了一步
作者: Minesweeper (lleh)   2018-08-20 05:20:00
https://arxiv.org/abs/1708.04782他们有尝试做局部的小游戏去测试的样子
作者: arrenwu (键盘的战鬼)   2018-08-20 05:26:00
与其说星海复杂 不如说围棋太简单了
作者: Minesweeper (lleh)   2018-08-20 05:38:00
结果这篇论文主要碰到的问题依然是战争迷雾
作者: enjoytbook (en)   2018-08-20 05:40:00
太简单个毛...啊不就是棒棒好棒棒
作者: Minesweeper (lleh)   2018-08-20 05:41:00
简单是相对于不完全资讯的游戏的复杂度
作者: orze04 (orz)   2018-08-20 05:42:00
围棋是完全资讯游戏 虽然几年前谁都不认为会被AI攻克
作者: arrenwu (键盘的战鬼)   2018-08-20 05:46:00
除了不完全资讯,连action space 都不一样复杂话说对SC2的project有尝试过关闭战争迷雾的实验吗?
作者: Minesweeper (lleh)   2018-08-20 05:50:00
局部有专家水准,全局游戏遇到一堆问题我也觉得至少也尝试一下开图吧...
作者: angel2210 (至死不渝)   2018-08-20 05:52:00
主要是战争迷雾下 侦查有可能得到假讯息
作者: arrenwu (键盘的战鬼)   2018-08-20 05:53:00
妳上面连结那篇paper的abstract里面是说ai玩mini-game可以学得跟novice player差不多 不是专家水准吧?
作者: angel2210 (至死不渝)   2018-08-20 05:54:00
然后这个讯息可以直接影响胜负
作者: arrenwu (键盘的战鬼)   2018-08-20 05:54:00
我比较怀疑的是...会不会开图也还是屌输啊XD
作者: Minesweeper (lleh)   2018-08-20 05:57:00
结论有写
作者: deathslipkno (Soloist)   2018-08-20 06:05:00
认真文,我走错版了
楼主: ohmylove347 (米特巴爾)   2018-08-20 06:07:00
我认为视觉化只是接收讯息的方式,但ai真正的重点在讯息的处理,虽然视觉化的讯息也是需要处理,不过这方面研究蛮久了算成熟的,所以我觉得视觉化不是很关键
作者: angel2210 (至死不渝)   2018-08-20 06:11:00
目前ai大概就是个内力100 招式0 智力0吧
作者: lturtsamuel (港都都教授)   2018-08-20 06:22:00
reinforcement还是会有最先的模型吧 不能说是从0开始
作者: smart0eddie (smart0eddie)   2018-08-20 06:45:00
Alpha Go到后来真的是从零开始的
作者: Minesweeper (lleh)   2018-08-20 06:50:00
With this initial release,we describe supervisedlearning results on the human replay data for policy and value networks
作者: orze04 (orz)   2018-08-20 07:01:00
上面有说到重点 围墙顶多是一人轮流一子 每一轮的落子就那些盘上的位置即时战略没有回合的概念,可以采取的动作种类与数量超大资讯种类也大于棋类游戏,资源量、建筑与战斗单位、科技………
作者: Minesweeper (lleh)   2018-08-20 07:05:00
回原po,他们得处理方式是:We describe the observation, action, and rewardspecification for the StarCraft II domain主地图切成几个小区域,然后详细观察小区域物件的互动不过即便如此,ai还是算不太完(电脑看到图,要在有限步骤内反应)
作者: uloyoy (FineTune)   2018-08-20 08:15:00
这篇我觉得不行 RL可以定义reward和action,并不是只有输赢然后让电脑去测
楼主: ohmylove347 (米特巴爾)   2018-08-20 08:27:00
没记错我记得deep mind好像用暴雪给的游戏分数,可是那个帮助好像也不大
作者: kinomon (奇诺 Monster)   2018-08-20 09:21:00
母汤喔 机器人准备要毁灭人类惹
作者: ssd860505da (JAGER)   2018-08-20 11:09:00
我倒不觉得记忆量是关键人类大脑在判断时也不会瞬间闪过一堆记忆,都是经年累月累积的经验,所以重点是要如何将经历过的事件转化为有意义的经验。例如replay buffer
作者: Jotarun (forever)   2018-08-20 11:19:00
看c恰讨论这种议题都笑笑就好 :P
作者: WindSucker (抽风者)   2018-08-20 12:04:00
学alphago先看别人对战记录分析胜率
作者: kira925 (1 2 3 4 疾风炭)   2018-08-20 13:28:00
用过了 一点意义都没有

Links booklink

Contact Us: admin [ a t ] ucptt.com