Re: [新闻] 人类对决 AI!《星海争霸》选手首次挑战

楼主: art1 (人,原来不是人)   2017-10-26 00:44:30
: 推 win4104: 现在阿法狗团队的瓶颈是 没办法把战局优劣势简单实时的 10/25 15:23
: → win4104: 量化 10/25 15:23
不太懂为什么没办法量化,去比较低、中、高阶的记录档就可以发现一些很主要的差异
例如:资源量、有效操作量、资源交换比
为什么 RTS 绝大部分提高游戏 AI 难度都是靠着给 AI 更多资源?
一大主因就是资源量很重要,当你的资源比对手少时,你只能靠着提高资源交换比
来扳回资源差距,影响资源交换比的要素太多就先不讨论,但若只是需要指标的话
,资源交换比绝对是需要列出来比较的
资源交换比就是你用了多少资源换掉对手多少资源,例如你不损一只就全歼对手全部
军事单位,这次交战的资源交换比就是对手生产军事单位所花掉的资源,去除以你用
来歼灭对手军事单位所花掉的资源
有效操作量对电脑来说可能比较没影响,因为电脑不会像人类一样玩到后期很容易脑
袋空空,下出一些很没意义的指令,不过有效操作量在哪个时间点该花在哪方面则是
需要深入研究
另一个很重要的是时间点,这边用快攻来说明比较方便,假设一边采取快攻,另一边
采取爬科技,若快攻方在那边一直屯兵,想说屯到数量够了才进攻,结果够了的时候
对方已经爬完科技,导致快攻方被高科技的兵屠杀
越早把资源用来生产军事单位,越要确保你的资源交换比够大,大到可以消耗或抵销
对手先把资源用来拼经济或科技所带来的优势;对手方则是反过来,尽可能地减少快
攻方的资源交换比
虽然比的还是资源交换比,但进攻时间点的选择则是取决于你的战术
从另一个角度来看,就是你花在军事单位上的资源到开始有资源交换比的闲置时间有
多长,通常时间越长越不好,不过由于星海不封路的场次很少见,所以这数据未必能
用来当量化指标
通常资源量、资源交换比都赢对手的情况下,都是胜利的一方
作者: win4104 (BB)   2017-10-26 00:55:00
要评价的是 这个营运流程能不能得到更高的资源量这个操作是不是有效操作这样的战术选择与配兵能不能得到更多的交换比五分钟内是这样 十分钟后是吗? 十五分钟后是吗?
作者: elfkiller (没有暱称)   2017-10-26 00:55:00
那AI在盖了一栋很贵的建筑后就会投降了 因为资源见底
作者: win4104 (BB)   2017-10-26 00:56:00
同样的操作在不同的情境下评价会不同而那个评价的依据还可能是来自还在战场迷雾中的资讯
楼主: art1 (人,原来不是人)   2017-10-26 00:57:00
以深度学习的做法来看,需要给的只有指标,剩下的靠训练过程这边说的资源量是累积的总量,不是目前手上拥有的资源
作者: win4104 (BB)   2017-10-26 00:58:00
Rts 没有那麽单纯 一只兵站在某个点上 从不同的角度解释可能是优 可能是劣局势大体会跟资源 交换比这些成正相关 但这不是绝对你有可能存了200的资源跟部队 但是因为没反隐形被一队隐刀 隐形女妖灭国
楼主: art1 (人,原来不是人)   2017-10-26 01:00:00
目前 AI 需要的就是单纯化的指标,不需要去考虑到太细
作者: win4104 (BB)   2017-10-26 01:01:00
或是照理来讲应该能完胜的部队在推进时被少量机动部队换家数字依据终究只能作为参考 没办法当作评价局势的重要依据
楼主: art1 (人,原来不是人)   2017-10-26 01:02:00
建筑物也是需要花掉资源,所以少量机动部队抄家就是达成高的资源交换比
作者: win4104 (BB)   2017-10-26 01:02:00
如果只用这些单纯的数字当指标 我相信AI会被多变的战术耍的团团转所以你要怎么评价这个行动能不能得到更高的交换比对方可能在正面 可能不是 如果是 我推进能打赢 如果不是我推进有可能被换家那推进这个选项的评价是什么
楼主: art1 (人,原来不是人)   2017-10-26 01:05:00
靠深度学习的算法,在经过大量训练之后,电脑能找出最佳参数,以实现资源量、资源交换比的最大化
作者: win4104 (BB)   2017-10-26 01:06:00
那个简单指标怎么定义就是我说的问题所在Deepmind尝试过让AI以游戏分数作为指标 结果AI从头到尾只会采矿
作者: yoyun10121 (yoyo)   2017-10-26 01:09:00
最难的就是怎样去定义出最好的指标呀..即时战略会影响胜负的指标比围棋多太多了
作者: enjoytbook (en)   2017-10-26 01:13:00
呵呵
楼主: art1 (人,原来不是人)   2017-10-26 01:17:00
如果你知道资源量、资源交换比跟胜率有正相关,为什么不想以这两个为简单指标呢?你是用局势跟那两者有关
作者: win4104 (BB)   2017-10-26 01:33:00
资源交换比跟胜率有正相关这也是必须参考其他情境分析不适用于所有情境
作者: yoyun10121 (yoyo)   2017-10-26 01:50:00
有正相关不代表相关性就够高..
楼主: art1 (人,原来不是人)   2017-10-26 06:03:00
所以简单指标必须适用于所有情境? 这是找指标的前提吗?
作者: win4104 (BB)   2017-10-26 09:24:00
如果你的指标代表性不够 那就不是个好的指标目标是要赢 如果达成指标却没能提高胜率 那要这个指标何用
作者: miname (>.<)   2017-10-26 10:11:00
围棋一样没办法知道每一步的优劣啊,AGZ是用蒙地卡罗搜寻不同落子点的胜率来做训练的
作者: win4104 (BB)   2017-10-26 10:46:00
作者: k1k1832002 (Matoriel)   2017-10-26 11:42:00
关于推文提到的一些问题,其实总归就是把人类行为规则找出来而已,目前各类自动化工程都类似这个状况,所以近年AI突破一个阶段就是神经学有所发展导致的,知道规则怎么跑,AI最简单的其中一项目标就是复制人类行为所以有些问题不是问题
楼主: art1 (人,原来不是人)   2017-10-26 12:36:00
什么时候已经证明资源量、资源交换比这两个指标无法提高胜率
作者: win4104 (BB)   2017-10-26 12:40:00
同样一个问题反过来问你呢?如果这些指标这么有效 Deepmind会没想到?会出现只会飞基地追求和局 跟只采矿追求分数这两种状况?这两个是Deepmind目前研究已经发生的状况
楼主: art1 (人,原来不是人)   2017-10-26 12:50:00
出现的那两种状况有注明说是用了哪些指标?我是不知道他们有没有想到那两个指标,因为他们没说所以我不会当成他们已经想过了
作者: win4104 (BB)   2017-10-26 12:57:00
第一个是胜利 第二个是星海本身的游戏积分机制再问个问题 是优势造成交换比上升 还是交换比上升造成优势? 根本的原因是什么 还是看到的只是结果资源 有效操作EPM 跟战损比 都是星海系统自己已经算好给你的数字连自己另外算都不用我不觉的他们会没试过
作者: ghostsun (晴阳)   2017-10-26 14:11:00
居然有人认为坐在ptt前想到的东西 专业研究人员没想过

Links booklink

Contact Us: admin [ a t ] ucptt.com