Re: [情报] 机器之心报导DeepMind AlphaStar yoyoyin0119 PTT批踢踢实业坊

Re: [情报] 机器之心报导DeepMind AlphaStar

楼主: yoyoyin0119 (UnSeenBlade) 2019-01-25 15:19:33

我觉得AlphaStar训练得有点歪掉了欸……
大家想得到的训练成果
应该是AI能够像人类一样
制定策略
预测对手行动
执行战术并反制对手战术
灵活的随机应变能力
从这些层面来击败人类选手获得胜利
结果这几场看下来
AlphaStar练成的是战术普普但是操作爆干强
秀出人类根本做不到的微控来获胜
但是这点在很久以前就有AI能做到了呀
何必训练一个AlphaStar来做到一样的事情
是不是因为为了训练方便直接让它读取API，也没特别限制手速
结果它找到最能获胜的手段就是直接用控兵干赢？
毕竟星海是设计给人来玩的
当初可不会设想到如果有手速是选手好几倍的超人来玩
会把游戏玩成什么样子……

作者: panruru1224 (boored) 2019-01-25 15:21:00

你要考虑在训练过程AS(除了一开始的imitation以外)AS并不知道人类的玩法而是AS互打这表示这类型的

作者: mrmowmow (mow) 2019-01-25 15:22:00

因为你说的早就有的ai的基本战略是人类key进去的，deepmind是自己学习这基本战略

作者: panruru1224 (boored) 2019-01-25 15:22:00

战术在双方手速相当的时候还是很好的战术

作者: arrenwu (键盘的战鬼) 2019-01-25 15:26:00

我是觉得AS不是训练来玩游戏的啦先把AS训练成“靠着神猛操作屌压人类”这目标没错因为目前还做不到

作者: Jotarun (forever) 2019-01-25 15:36:00

你真要知道他怎么控制先把这篇看完http://bit.ly/2WitmMy然后训练成怎样本来就是未知的

作者: homelife (SKY) 2019-01-25 15:53:00

昨天看完直播并不觉得每场都只靠控兵阿，真的夸张的不是只有360度追猎那场吗? 另一场AI裂光球还误炸自己好几次

作者: martinmask (Michael) 2019-01-25 16:22:00

有没有视频连结

作者: azeroth (呆脑羊咩咩) 2019-01-25 16:24:00

VOD前面几篇有

作者: z83420123 (VoLTsRiNe) 2019-01-25 16:25:00

误炸自己好几次那是第一周第一周操作看的出来没训练好会战有点忙不过来但第二周那操作就不开玩笑了第一周那个大家更多还是吐槽tlo在打三小第二周被那操作看傻了

作者: jim8596 (休刊是童年的回忆) 2019-01-25 16:28:00

隐刀那场输在操作好奇被大招电脑要怎么解

作者: richard82010 (HatsuneMiku) 2019-01-25 16:52:00

或是AS经过百万场对战发现自己最强的方式就是提高所有单位的生存率，而最容易达成的方式就是惊人的微操.....利用自己绝对不会点歪的优势

作者: Raikknen (Kimi) 2019-01-25 16:52:00

你不得不承认AI学习能力是飞快进步的

作者: hijacker (懒人一枚) 2019-01-25 16:54:00

他的微操也是靠学习来的啊

作者: penut85420 (PenutGGorz) 2019-01-25 17:10:00

因为赢得胜利的一方通常操作都很好

作者: toya123 (雷姆在我床上闭嘴) 2019-01-25 17:10:00

一定是韩国人带坏阿法星的

作者: yeldnats (夜那) 2019-01-25 17:21:00

其实只是控兵很夸张夺走目光，看到360追猎就认为是靠微操，不过多面夹击优势虽然对人是常识，要AI自己学习出来却是困难的

作者: willtaiwan (台湾能) 2019-01-25 17:29:00

很多亮点，他会分兵守先知，被菱镜不朽弄到还是有应对，只是不是最佳应对

作者: miha80425 (ohsialay) 2019-01-25 17:37:00

说到底RTS是操作游戏围棋限时下子差多了极限大概就是防守应对以最低代价获得优势+高效操作碾想看到的AI战略思维似乎是没有

作者: nissptt (niss) 2019-01-25 17:41:00

楼主要说的是"战略普普"吧?对应战争。?缩小一级才是战术，对应战役。操作又更小一级, 对应哪个词汇我不清楚。至于跨小分，不同局的应对，AI应该不如真人。

作者: angeltear15 (嘉明湖) 2019-01-25 17:41:00

花两年弄出悍马2000 真的废到笑

作者: ohmylove347 (ç±³ç‰¹å·´çˆ¾) 2019-01-25 17:45:00

已经很强了，这个进步是大家难以想像的快，我们几代的超猛AI就快来了不用担心

作者: miha80425 (ohsialay) 2019-01-25 17:47:00

妈的大失业时代真的要来了XD

作者: Jotarun (forever) 2019-01-25 17:48:00

废到笑的是不懂内涵觉得这个废的人吧 LUL

作者: miha80425 (ohsialay) 2019-01-25 17:54:00

现在商用AI可以从只回答一个问题到分辨不同问题回答再进化一点客服人员真的没饭吃

作者: TFsonG 2019-01-25 17:55:00

还有很长一段路要走

作者: peanutman (偷~~岛~~林) 2019-01-25 18:11:00

想看AI打Has XD

作者: Jotarun (forever) 2019-01-25 18:15:00

客服AI 喔那个真的是废到笑

作者: qoo60606 (凛) 2019-01-25 18:18:00

算法不知道用哪些很有趣

作者: Jotarun (forever) 2019-01-25 18:23:00

主要的算法DeepMindblog有写可以找我的两篇文都有连结

作者: hikerLin (自慢) 2019-01-25 18:28:00

AI被针对弱点之后怎么自动学习改进才是想看的

作者: qoo60606 (凛) 2019-01-25 18:48:00

只看得懂是深度神经网络其他不懂了qq

作者: tasin (Ringo) 2019-01-25 18:52:00

操作学习上我也觉得占得太多导致ai的配兵从tlo的版本到mana的版本反而越来越单纯虽然她会拉阵包夹真的很屌

作者: WindSpread (阳だまりの诗) 2019-01-25 18:54:00

AS:SIMPLE IS BEST (blinkblinkblink

作者: zephyr (断了线的风筝) 2019-01-25 18:57:00

应该可以透过参数调整再训练现在的条件好的解是靠操作但重点是七天练两百年的流程已经建立起来了训练条件不同可能就会生出其他的最佳解

作者: qoo60606 (凛) 2019-01-25 19:01:00

https://www.youtube.com/watch?v=5iZlrBqDYPM

作者: LochtsStorM (Lochts) 2019-01-25 19:39:00

打的目的就是要顺便看看大家的想法说废到笑的还满可怜的

作者: catmeat777 (多萝喵) 2019-01-25 19:52:00

说废的连AI都打不赢，不意外

作者: confucamus 2019-01-25 19:59:00

操作也是建立在营运没有问题的情况下好吗，不然找个可以这样营运的的来看看，悍马2000有做到这个吗?

作者: APM99 (血统纯正台北人) 2019-01-25 19:59:00

两年前就说过DeepMind 选错游戏了星海2是操作为主的游戏DeepMind 当初就该去选没有'a'的即时战略游戏可是不少阿只是那些游戏都没玩家了^^Maru或Serral 依靠的都是操作取胜论策略预测执行灵活这篇推文抽十个说不定都能有五个比这两位顶尖选手强

作者: fragmentwing (片翼碎梦) 2019-01-25 20:28:00

觉得战术搭配到敌我手速差别也不是不行不过这得有个度故意让对方要用高手速来互拼的当然可以但是不是靠手速万解打法serral、maru也算很会变换战术和心理战的选手了

作者: z83420123 (VoLTsRiNe) 2019-01-25 20:38:00

这篇推文论策略预测执行灵活我可以说一个都不会有比他们强

作者: fragmentwing (片翼碎梦) 2019-01-25 20:39:00

八卦是刚刚看到TLO手速也飙到1350过w

作者: Jotarun (forever) 2019-01-25 20:39:00

光没玩家这件事就不行啊这已经是赔钱生意连知名度都没

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 20:39:00

阿那个就刷出来的东西不一样的

作者: Jotarun (forever) 2019-01-25 20:40:00

还搞啥而且操作也是要学习的又不是乱按按的快就行看之前其他AI打起来都什么鬼样子就可以知道这个问题的难度人家看上的也是难度话说Facebook上次围棋输这次SC2也是暂时落后蛮多的不知道Lecun私底下会不会发飙XD

作者: Pegasus99 (天马行空...的天马) 2019-01-25 20:51:00

如果每个人都知道DeepMind是什么意思就不会有人以为AI是靠手速赢的

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 20:51:00

FB好像是去玩星海一的AI 不过....第一名也没拿到XD不 AI昨天确实就是用手速赢的他的战略很明确因为有可靠的高手速所以他的战略就是纯粹堆追猎然后拼操作强压当然这个跟简化成"AI只是会操作"有点微妙的不同但是要说这个不是靠手速...他是靠手速阿

作者: Pegasus99 (天马行空...的天马) 2019-01-25 20:54:00

那就是你只知道表面了很高兴你自告奋勇的解释

作者: APM99 (血统纯正台北人) 2019-01-25 20:54:00

这跟表面无关这跟游戏本质有关这游戏本来就是靠操作

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 20:55:00

我想这边已经辩论过两轮到底怎样了半途跳出来喊你们不懂呵呵呵

作者: Pegasus99 (天马行空...的天马) 2019-01-25 20:56:00

DeepMind一定要选星海这种复杂度够高的RTS 才能代表他真的有学到东西所谓的DeepMind就是为了跟一般的学习型AI做区分:如果开发团队有照着定义的话 DeepMind是指人类从来没有教他要做什么甚至不应该给他棋谱/RP 而是单纯让他学习星海是什么样的游戏告诉她操作方法后让他自己去跑也就是

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 20:59:00

好现在我们明确知道是谁只知道表面了

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:00:00

说DeepMind是在不知道大家怎么玩星海的前提下去打到现

作者: paul012011 (小全) 2019-01-25 21:00:00

k大前面的意思是因为手速设定的问题理论上应该要钻研战略的AI一头钻进去生基本兵后疯狂微操

作者: KTZest (P7GAB) 2019-01-25 21:01:00

这个AI打得赢韩国顶尖神族吗？

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:02:00

人类想像的战略这样不能否定从无到有的这种惊人的自学成果

作者: miha80425 (ohsialay) 2019-01-25 21:03:00

AI没有聪明到会证1+1 他会找最简单的方式解决但是人类想让AI变到会证1+1 而不是直接给2这个答案用这例子解释不会看不懂吧

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:04:00

一个AI为了胜利从单纯的拼操作自己学习到原来有"战略"这样的东西并且实际表现出来且逼近人类认同的想像这是非常美丽且厉害的事情

作者: qoo60606 (凛) 2019-01-25 21:06:00

内行看门道

作者: Jotarun (forever) 2019-01-25 21:06:00

我理解看了AlphaGo以后有些人希望AlphaStar一样是智取但是系统学出来怎样就是怎样他们并没有直接去设定

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:07:00

miha的举例我觉得可以不过正因为星海的难度(或我们称规则)复杂所以当他能够自学出人们想出的战略时比起棋类这种容易有最佳解的游戏来说更让人惊艳

作者: paul012011 (小全) 2019-01-25 21:09:00

问题在于原本AI的APM设定理论上要在人类水准(以下)的结果这次比赛的里已经飙到有点像悍马2000了

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:10:00

举个例子:以往的学习型AI(也是像人类的学习方式) 如果

作者: Jotarun (forever) 2019-01-25 21:10:00

他们并没有特别设定APM

作者: paul012011 (小全) 2019-01-25 21:10:00

AI学习的前提是其他条件要和人类相仿啊

作者: Jotarun (forever) 2019-01-25 21:11:00

他就是从人学来的啊人不也是平常某个APM 但偶而会飙起来

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:12:00

但deepmind不一样他的学习方式是:你给他一推设计图可

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:12:00

再说一次人类飙上去的APM与AI飙上去的APM不等价

作者: Jotarun (forever) 2019-01-25 21:12:00

这以后他们应该会再看要怎么处理

作者: miha80425 (ohsialay) 2019-01-25 21:13:00

就用卡尔达肖夫类似的说法 AI实现分三阶段

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:13:00

我的意思就是 Deepmind一开始就设计错规格了

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:13:00

子这时他根本不知道什么是好房子但她在学习中发现房

作者: Jotarun (forever) 2019-01-25 21:14:00

我再讲一次没有设计规格

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:14:00

子之间的差异而且他能推纳出有些是好的有些是坏的最

作者: miha80425 (ohsialay) 2019-01-25 21:14:00

3.阿发X 特殊最佳解也就是超越人类

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:15:00

后做出自己的房子

作者: lovinlover (Lovin Lover) 2019-01-25 21:15:00

小色现在在Olimo讲解AlphaStar XD

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:16:00

他就是这里错误好了吗? 他没有规范好边界条件把所有超过人类合理操作极限的所有模型干掉做出来对很强操作天下第一但是收敛错了

作者: miha80425 (ohsialay) 2019-01-25 21:16:00

人类文明无法实验到最佳解资源金钱实在不够用

作者: qoo60606 (凛) 2019-01-25 21:17:00

别这样围棋也是超过人类合理思考极限阿他就是做出超过人类水平的正常发挥嘛

作者: miha80425 (ohsialay) 2019-01-25 21:17:00

要阿发X算出好的方案再进行实验这才是AI发展

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:17:00

星海争霸是一个在设计上就透过引入操作性去设计单位交换

作者: Jotarun (forever) 2019-01-25 21:18:00

太早设限才不对你根本不知道系统出来的结果是怎样

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:18:00

的游戏忘记这一点讲的天花乱坠根本没有用

作者: miha80425 (ohsialay) 2019-01-25 21:19:00

放心啦阿发星团队也不会接受这样的结果

作者: Jotarun (forever) 2019-01-25 21:20:00

如果只要APM就赢了那怎么不见其他AI早早用这招?而且现在只是过程而已一直抓着这点说人家错很奇怪

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:22:00

就我所看到的是阿法星在deepmind的学习行为下发明了

作者: Jotarun (forever) 2019-01-25 21:22:00

实际上在训练的过程之中 AlphaStar确实也展现了很多策略一开始只会rush 后来就会农或者骚扰

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:23:00

营运产兵作战而作战时要使用战术最后再加上大家诟

作者: qoo60606 (凛) 2019-01-25 21:23:00

你看FB团队没设APM还是打不赢阿(欸

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:26:00

你们根本没认知到在没有合理规范收敛范围下

作者: aCCQ (阿贤) 2019-01-25 21:26:00

讨论的前题不一样一个是人机大战公平性一个是着重学习成果

作者: aCCQ (阿贤) 2019-01-25 21:27:00

你们讨论是没有结果的

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:27:00

对学习成果很了不起他是把之前没人解决的模型做出来了但是他实际上解错了东西好吗这个游戏的设计里面就已经先隐藏预定了操作的限制

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:29:00

那是你以为他解错了:他并没有因为知道高APM能够追猎能

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:29:00

单位的伤害输出与血量装甲云云都与这有牵连现在你扔一个超过设计规范的东西下去那玩的就已经不同了

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:31:00

.........你以为人类真不知道操作完美的追猎可以赢不朽?

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:34:00

知道但因为不会形成问题所以不会解决这个现象如果是其他领域呢? 一个没有人为定义或种族平衡的世界他不能想出人类无法解决的问题的答案吗?

作者: kira925 (1 2 3 4 疾风炭) 2019-01-25 21:37:00

所以我在说你们想像的星海不是现实人类在打的星海

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:37:00

如果你是因为热爱星海所以看出星海的缺陷那你完全没有问题但从这场比赛同时也让看到deepmind的未来

作者: Rex1009 (冬の影) 2019-01-25 21:38:00

你们讲的就两回事完全没有交集P大觉得我performance变好就能发paper了K大觉得我要买一个solution结果你给我一个我做不到的问题的定义不一样

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:42:00

我会这样解释很简单:因为deepmind不是为了成为星海第一而研发的他是研发一个超级AI能够解决问题包括星海如果为了解决单一问题而发展AI 就跟前一世代的AI没什么两样了就跟你没办法定义一个从小栽培数学且表现特好的孩子为数学天才但你可以称略懂基本知识而能解决延伸问题的为天才

作者: Rex1009 (冬の影) 2019-01-25 21:48:00

我相信Deepmind有野心要有一个强AI算法但是AlphaStar的限制条件会被挑战也很正常所以这个project这样肯定是不型的

作者: Pegasus99 (天马行空...的天马) 2019-01-25 21:50:00

老板大怒

作者: lovinlover (Lovin Lover) 2019-01-25 21:53:00

老仙刚刚说了 5:0MANA的系列战是刻意不限制APM

作者: energyy1104 (Bill Wang) 2019-01-25 21:55:00

客服AI听起来超废大家就是想对活生生的客服狂骂啊

作者: tsairay (火の红宝石) 2019-01-25 23:40:00

这个再发展下去..AI控制的兵器很快就会出现了

作者: miha80425 (ohsialay) 2019-01-26 02:41:00

根据国外一些八卦 google离职员工说不想间接参与战争搞不好早就有了

作者: AMTS 2019-01-26 03:31:00

认真觉得纯粹立场不同 AI开发者其实没很在意输赢只是想观察他表现出来的模式以现在来说算很有成果了

作者: angeltear15 (嘉明湖) 2019-01-26 10:26:00

事实上就是两年算出操作>>>>>all不是废到笑是什么？不就跟花几百万研究证明冰箱耗电比较大一样

作者: Jotarun (forever) 2019-01-26 10:50:00

不懂装懂还言之凿凿真可悲先把这个研究的目的搞懂吧

作者: eyesg (å½ŒåéƒŽ) 2019-01-26 12:47:00

星海就屁孩游戏不需要啥智商越年轻手越快越有优势

作者: angeltear15 (嘉明湖) 2019-01-26 13:46:00

麻烦那个所谓懂的人快去把阿法Go 弄好我再来推你不然其实也只是死鱼在装高潮谁比较可悲? 哈

作者: Jotarun (forever) 2019-01-26 14:18:00

都2019了还在Go 先去念点书吧

作者: eyesg (å½ŒåéƒŽ) 2019-01-26 14:27:00

这种AI强大在于它没有寿命你会死我会死怎么学习都有归零的一天悍马2000不会成长更是垃圾但是阿发系列他们有精神时光屋只要砸钱在硬件上可以达到非人的学习时间星海普通玩家打十年最多15000场 20000场但是他可以一秒数十盘而且他没有寿命虽然学习的速度跟人类比极慢慢需要人类帮他调整方向增加效率...但是他永恒不死目标又又由人类设定未来在军事上工程上维护跟管理将会大幅淘汰人类你觉得垃圾只是代表你很无知

作者: arrenwu (键盘的战鬼) 2019-01-26 14:32:00

那个前提是AI要能够越来越强啊

作者: micbrimac (shark) 2019-01-27 06:29:00

无知的是让AI练的下去以后取代人类

作者: juicylove (juicy) 2019-01-27 09:56:00

就没那么容易做到啊已经进步很多了

继续阅读

[情报] 机器之心报导DeepMind AlphaStarJotarun [问题] 关于凯姊跟诺娃的强度papertim [情报] GSL改制？WCS跟GSL只能择一参加？capssan [问题] 泽拉图合作bugallencyh [联赛] FRIEND SHIP #2 - Has vs. Leenock BO11AzureRush [实况] byun 音乐台barry00561 [情报] DeepMind AlphaStar星海示范赛Jotarun [情报] 炽热青春(BZS:May) 月底回归AzureRush [买卖] 星海争霸2三部曲典藏版实体包Valvetronic [情报] 本周异变：极限超频fragmentwing