Re: [闲聊] 黄士杰博士:AlphaZero团队登上Science

楼主: para123 (好心情,事才会做好)   2018-12-13 07:13:53
围棋、星海、卡牌游戏,以及电脑AI什么的,
这些项目虽然小弟全部都是菜逼,但都略有涉及,聊到这个就很多看法想分享一下:
用人工智能来进行竞赛游戏,我想无非就是看成绩单说话吧,
就像围棋,电脑一堆下法,若是在alphago还没问世前,经由人手下出来,那么
肯定不是被人笑就是被老师骂,
偏偏咱们的alphago老师最后都用成绩说话,也不跟你嘴,
人类也才终于开始愿意检讨自己,检讨一堆人类(围棋)世界的铁则,
重点就是:成绩。
而人工智能,小弟没读书,用句直白话说吧,
[纯手工打造AI] v.s. [自学型AI],似乎又是两码子事,
就拿围棋来说吧,被人类价值观影响与否的围棋AI,表现出来的水准就是两个档次,
甚至过往那些不依靠自学的纯手工围棋AI,棋力怎么样我就不好意思说了大家都很清楚。
看待事情的面相很多,但我想就先用最现实的 "成绩" 来说吧,
如果要用人类跟AI来做比较,我认为在卡牌游戏上,AI的成绩肯定比较差,
但绝对不是因为卡牌游戏难掌握,
对电脑来说,这些卡牌游戏的计算,实在是简单到爆,
就是单纯的数学游戏罢了,
常常我们觉得 "复杂" 、觉得 "变化多" ,在电脑眼里都是1秒钟的事,
看着自己满手牌+场上敌我一堆牌,你是不是觉得伤透脑筋觉得好多变化阿,
好难决定要先出哪张,好难决定出牌次序啊,
但那是对人来说啊,
电脑就算用土法炼钢也是1秒钟的事,
那些我们觉得复杂的感觉,常常都只是一种能力不足而导致的错觉。
一款卡牌游戏就算设计了100万种卡片,
但在对战的过程中,每个当下其实也就是你看得到的那几张牌,
对于其他看不到的部分的猜测与推想都是没意义的,
也可以说是有意义啦,
因为运气这种东西,本来就是左右著卡牌游戏的最大关键,
对,就是最大,
这也就是为什么我会说在卡牌游戏中,比起星海或围棋,人类胜率反而会高的原因。
比较值得关注与讨论的议题应该是这些即时战略的游戏吧,
我认为,前面所说 "手工型" vs "自学型" ,可能会有很大的出入,
至少在初期是吧,
即时战略的东西,分秒瞬息万变,
要让电脑从当中自我学习并慢慢理出逻辑,理出所谓的真理、并学习,觉得需要
花费不少的时间,
其实关于星海的 "学习型AI" ,确实有网站24小时在转播电脑自己跟自己PK的实况,
目前都还是玩得非常爆笑,而且常常很容易出现单位在原地左右高速抖动的画面,
要让电脑 "学" 到足以打败人类,我认为还需要花非常大的资源。
但如果是 "手工型" 呢?我认为电脑很快就可以打败人类了,
我们所谓很多的 "战术" ,都会有时间轴,
什么样的进攻,最快大概是几分几秒会完成、会抵达,
这个战术的几分几秒会有空窗期,
这张地图从A点走到B点要多少时间,
这些东西不用说是电脑,光人脑都已经掌握得很好了,
所以战术上的斗智,如果能借由人类 "手工" 来辅助,电脑很快就能掌握得差不多,

有一个部分,电脑有着无比巨大的优势,
那就是APM的部分,(以下少部分内容适合游戏玩家)
所有的 "战术" ,所有对战场上的理解与判断,都必须建立在
对自己的 "兵" 的了解,
不是只有游戏,真正的战争,甚至职场商场上都一样,
同样是派 "一个人" 去做一件事,但派A去跟派B去就是两回事,
回头说说即时战略吧,
看起来,大家都用一样的兵,
你有10只机枪兵,我有8只机枪兵,
长得一模一样,看起来就是10只会打赢,
但是如果10只在我手上,8只在电脑手上,
那我就觉得干我输定了,
因为电脑手上的机枪兵每只都是张飞啊!
当今星海的职业赛何不是如此呢?
同样的战术同样的场合,
A玩家拿来对付B玩家是正确的战术,但A玩家拿来对C玩家用就是错误的战术!
即时战略的APM往往跟胜败成正比,
偶有智商压制或失误就另当别论,
用个星海争霸二的内容举个例子吧,
你可以用1只追猎者打赢1只狂战士,因为有操作空间,
但是如果同时间有8个地方都在 1追猎vs1狂战 呢?
你如果有3000apm我想肯定是没问题,8处都赢,
但如果只有300apm甚至更低呢?
所以apm不同的世界,很多观念与理解可能都会颠覆,
即使不懂电玩,那就想想那alphago,
是不是用那超乎常人的计算力,颠覆了我们对围棋的理解呢?
话讲了一堆,简单说个结论吧,只是我个人的看法:
论成绩,人类 vs 电脑,
卡牌游戏,AI能轻松掌握,但成绩未必理想。
星海争霸,自学型AI必须花不少的资源学习,未来肯定超过手工型;
而手工型,可以在很短的时间内大胜人类。
而围棋嘛,成绩已经摊在眼前了 xD
题外话,
好期待有一天会出现并推广[球型棋盘],
想像两个人在地球仪上面下棋就对了,
希望有一天,能看到顶尖围棋AI在球型棋盘上下棋,
再由幽默风趣的棋士一边转动着地球仪一边转播战况~
作者: BBSealion (海狮)   2018-12-13 10:16:00
APM 我认为会限制的,要挑战这题目就是想挑战智能极限而不是拿电脑本来就有的优势来压制人类,这样就失去意义,顶多搏一波新闻,但DeepMind想做的绝对是从根本上的智能去赢过人类,这样才有发下一篇Science的价值
作者: buji (卜基)   2018-12-13 12:01:00
地球棋盘很有意思
作者: hit0123 (@@")   2018-12-13 12:11:00
apm老早说会刻意压到跟人接近
作者: indium111 (#ttyhg)   2018-12-13 13:54:00
即使跟人类相同的apm,电脑在计算上远超人类比如一只大和舰面对一群机枪兵该在第几秒撤退,人类算不出来,但电脑可掉很精细的神操作境界但如果要从0开始学起,星海这个大棋盘可比围棋复杂多了
作者: deerdriver (骑鹿人)   2018-12-13 16:46:00
说不定只是算法不合啊
作者: ilw4e (可以吃吗?)   2018-12-13 22:46:00
APM设限电脑也一定会优化成最有效的动作
作者: ddavid (谎言接线生)   2018-12-14 02:21:00
就说APM会限制了还在APM辗压XD然后这篇对难度的分析不能说完全错,但是忽略很重要的一点在于卡牌跟星海都是属于不完全资讯游戏,这类游戏在根本难度就是比起完全资讯游戏高,主要在于自我学习的不确定性围棋这种东西是有绝对正确解答的,一路下下去,到最后就是每一手的资讯都很清楚可以完全重现卡牌、星海就不一样了,你在场上遇到完全同样的局面,事实上看不到的东西可能天差地远,这就增加了学习上的困难至于卡牌靠不靠赛,其实还是要看是哪一种卡牌,不同游戏其实靠赛程度差距很大。而且卡牌游戏本来就是一种“玩家尽可能打到最好,剩下才交给机率”的一类游戏(如同麻将、桥牌),顶级的玩家长久下来胜率肯定是比一般玩家高的,只是不同的卡牌游戏会决定这个高低差距远不远,越靠赛的差距越小,技术成分越重的差距越大。而且别忘了卡牌游戏还有组套牌这个环节,光是赛场预测跟套牌选择、对应等等上场之前的准备就能让高端职业玩家跟一般玩家的胜率拉开不少。虽然AI研究应该还玩不到这个地步就是XD另外上面提到星海AI可以极度优化操作这部分,上一篇推文已经说过了,早就有利用旧式AI概念做出来的完美操作AI。但之所以说是旧式AI,就因为那是由人类直接告诉AI怎么操作最好,然后由AI去计算做到最完美所以达成的。从深度学习来做就彻底不是这么一回事了。深度学习AI光是要自学出怎么操作叫做好这回事就很困难,更不用说前提是还得懂得生产兵种出来。你想做出完美的Marine海无损打爆炸虫群,前提也要是AI能学到正确的时间点会出到足量的Marine研发好打针而且还能正确派到认为毒爆虫会来的地方。对人类看起来并不会很难理解的一套体系,深度学习要从头学下来可没那么容易──因为人脑学习这些东西其实也比你想像中困难许多,只是人脑规格够高且本来就相对擅长这种不完全资讯下的推理。
作者: alisha2224 (霂楠)   2018-12-14 10:02:00
apm会限制,但会失误跟不会,还是有巨大差距的
作者: butten986 (白色的恶魔)   2018-12-15 11:16:00
如果真的能在限制apm的情况下摸出战术,拿到现实也行
作者: ddavid (谎言接线生)   2018-12-16 02:13:00
@alisha2224 你说的没错,但问题就是在星海这个剧本下,深度学习要学到怎样的操作是不是失误难度蛮高的之前一直提到的,他们连好好采矿开局都还学不起来,就是因为怎么样的操作算是好这件事要自然由深度学习自己学到并不容易
作者: capita (小明)   2018-12-17 02:23:00
实务上球形棋盘是横向循环并不理想 所以很难推广上下左右都无边的循环棋盘 在拓扑结构上其实是环状的棋盘
作者: Minesweeper (lleh)   2018-12-18 02:07:00
https://arxiv.org/abs/1708.04782去年星海AI的进度,我看是很惨啦
作者: clarkyoona (clarkyoonazang)   2017-02-13 11:52:00
好好笑喔这篇

Links booklink

Contact Us: admin [ a t ] ucptt.com