Re: [情报] 机器之心报导DeepMind AlphaStar

楼主: yoyoyin0119 (UnSeenBlade)   2019-01-25 15:19:33
我觉得AlphaStar训练得有点歪掉了欸……
大家想得到的训练成果
应该是AI能够像人类一样
制定策略
预测对手行动
执行战术并反制对手战术
灵活的随机应变能力
从这些层面来击败人类选手获得胜利
结果这几场看下来
AlphaStar练成的是战术普普但是操作爆干强
秀出人类根本做不到的微控来获胜
但是这点在很久以前就有AI能做到了呀
何必训练一个AlphaStar来做到一样的事情
是不是因为为了训练方便直接让它读取API,也没特别限制手速
结果它找到最能获胜的手段就是直接用控兵干赢?
毕竟星海是设计给人来玩的
当初可不会设想到如果有手速是选手好几倍的超人来玩
会把游戏玩成什么样子……
作者: panruru1224 (boored)   2019-01-25 15:21:00
你要考虑在训练过程AS(除了一开始的imitation以外)AS并不知道人类的玩法 而是AS互打 这表示这类型的
作者: mrmowmow (mow)   2019-01-25 15:22:00
因为你说的早就有的ai的基本战略是人类key进去的,deepmind是自己学习这基本战略
作者: panruru1224 (boored)   2019-01-25 15:22:00
战术在双方手速相当的时候还是很好的战术
作者: arrenwu (键盘的战鬼)   2019-01-25 15:26:00
我是觉得AS不是训练来玩游戏的啦先把AS训练成“靠着神猛操作屌压人类”这目标没错因为目前还做不到
作者: Jotarun (forever)   2019-01-25 15:36:00
你真要知道他怎么控制 先把这篇看完http://bit.ly/2WitmMy然后训练成怎样本来就是未知的
作者: homelife (SKY)   2019-01-25 15:53:00
昨天看完直播并不觉得每场都只靠控兵阿,真的夸张的不是只有360度追猎那场吗? 另一场AI裂光球还误炸自己好几次
作者: martinmask (Michael)   2019-01-25 16:22:00
有没有视频连结
作者: azeroth (呆脑羊咩咩)   2019-01-25 16:24:00
VOD前面几篇有
作者: z83420123 (VoLTsRiNe)   2019-01-25 16:25:00
误炸自己好几次那是第一周第一周操作看的出来没训练好 会战有点忙不过来但第二周那操作就不开玩笑了第一周那个大家更多还是吐槽tlo在打三小 第二周被那操作看傻了
作者: jim8596 (休刊是童年的回忆)   2019-01-25 16:28:00
隐刀那场输在操作 好奇被大招电脑要怎么解
作者: richard82010 (HatsuneMiku)   2019-01-25 16:52:00
或是AS经过百万场对战发现自己最强的方式就是提高所有单位的生存率,而最容易达成的方式就是惊人的微操.....利用自己绝对不会点歪的优势
作者: Raikknen (Kimi)   2019-01-25 16:52:00
你不得不承认AI学习能力是飞快进步的
作者: hijacker (懒人一枚)   2019-01-25 16:54:00
他的微操也是靠学习来的啊
作者: penut85420 (PenutGGorz)   2019-01-25 17:10:00
因为赢得胜利的一方通常操作都很好
作者: toya123 (雷姆在我床上 闭嘴)   2019-01-25 17:10:00
一定是韩国人带坏阿法星的
作者: yeldnats (夜那)   2019-01-25 17:21:00
其实只是控兵很夸张夺走目光,看到360追猎就认为是靠微操,不过多面夹击优势虽然对人是常识,要AI自己学习出来却是困难的
作者: willtaiwan (台湾能)   2019-01-25 17:29:00
很多亮点,他会分兵守先知,被菱镜不朽弄到还是有应对,只是不是最佳应对
作者: miha80425 (ohsialay)   2019-01-25 17:37:00
说到底RTS是操作游戏 围棋限时下子差多了极限大概就是防守应对 以最低代价获得优势+高效操作碾想看到的AI战略思维似乎是没有
作者: nissptt (niss)   2019-01-25 17:41:00
楼主要说的是"战略普普"吧?对应战争。?缩小一级才是战术,对应战役。操作又更小一级, 对应哪个词汇我不清楚。至于跨小分,不同局的应对,AI应该不如真人。
作者: angeltear15 (嘉明湖)   2019-01-25 17:41:00
花两年弄出悍马2000 真的废到笑
作者: ohmylove347 (米特巴爾)   2019-01-25 17:45:00
已经很强了,这个进步是大家难以想像的快,我们几代的超猛AI就快来了不用担心
作者: miha80425 (ohsialay)   2019-01-25 17:47:00
妈的 大失业时代真的要来了XD
作者: Jotarun (forever)   2019-01-25 17:48:00
废到笑的是不懂内涵觉得这个废的人吧 LUL
作者: miha80425 (ohsialay)   2019-01-25 17:54:00
现在商用AI可以从只回答一个问题到分辨不同问题回答再进化一点 客服人员真的没饭吃
作者: TFsonG   2019-01-25 17:55:00
还有很长一段路要走
作者: peanutman (偷~~岛~~林)   2019-01-25 18:11:00
想看AI打Has XD
作者: Jotarun (forever)   2019-01-25 18:15:00
客服AI 喔 那个真的是废到笑
作者: qoo60606 (凛)   2019-01-25 18:18:00
算法不知道用哪些 很有趣
作者: Jotarun (forever)   2019-01-25 18:23:00
主要的算法DeepMindblog有写 可以找我的两篇文都有连结
作者: hikerLin (自慢)   2019-01-25 18:28:00
AI被针对弱点之后怎么自动学习改进才是想看的
作者: qoo60606 (凛)   2019-01-25 18:48:00
只看得懂是深度神经网络 其他不懂了qq
作者: tasin (Ringo)   2019-01-25 18:52:00
操作学习上我也觉得占得太多导致ai的配兵从tlo的版本到mana的版本反而越来越单纯虽然她会拉阵 包夹真的很屌
作者: WindSpread (阳だまりの诗)   2019-01-25 18:54:00
AS:SIMPLE IS BEST (blinkblinkblink
作者: zephyr (断了线的风筝)   2019-01-25 18:57:00
应该可以透过参数调整再训练 现在的条件 好的解是靠操作但重点是七天练两百年的流程已经建立起来了训练条件不同可能就会生出其他的最佳解
作者: qoo60606 (凛)   2019-01-25 19:01:00
作者: LochtsStorM (Lochts)   2019-01-25 19:39:00
打的目的就是要顺便看看大家的想法说废到笑的还满可怜的
作者: catmeat777 (多萝喵)   2019-01-25 19:52:00
说废的连AI都打不赢,不意外
作者: confucamus   2019-01-25 19:59:00
操作也是建立在营运没有问题的情况下好吗,不然找个可以这样营运的的来看看,悍马2000有做到这个吗?
作者: APM99 (血统纯正台北人)   2019-01-25 19:59:00
两年前就说过DeepMind 选错游戏了 星海2是操作为主的游戏DeepMind 当初就该去选没有'a'的即时战略游戏 可是不少阿只是那些游戏都没玩家了^^Maru或Serral 依靠的都是操作取胜 论策略预测执行灵活这篇推文抽十个 说不定都能有五个比这两位顶尖选手强
作者: fragmentwing (片翼碎梦)   2019-01-25 20:28:00
觉得战术搭配到敌我手速差别也不是不行不过这得有个度故意让对方要用高手速来互拼的当然可以但是不是靠手速万解打法serral、maru也算很会变换战术和心理战的选手了
作者: z83420123 (VoLTsRiNe)   2019-01-25 20:38:00
这篇推文论策略预测执行灵活我可以说一个都不会有比他们强
作者: fragmentwing (片翼碎梦)   2019-01-25 20:39:00
八卦是 刚刚看到TLO手速也飙到1350过w
作者: Jotarun (forever)   2019-01-25 20:39:00
光没玩家这件事就不行啊 这已经是赔钱生意 连知名度都没
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 20:39:00
阿那个就刷出来的东西 不一样的
作者: Jotarun (forever)   2019-01-25 20:40:00
还搞啥 而且操作也是要学习的 又不是乱按按的快就行看之前其他AI打起来都什么鬼样子就可以知道这个问题的难度 人家看上的也是难度话说Facebook上次围棋输 这次SC2也是暂时落后蛮多的不知道Lecun私底下会不会发飙XD
作者: Pegasus99 (天马行空...的天马)   2019-01-25 20:51:00
如果每个人都知道DeepMind是什么意思 就不会有人以为AI是靠手速赢的
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 20:51:00
FB好像是去玩星海一的AI 不过....第一名也没拿到XD不 AI昨天确实就是用手速赢的 他的战略很明确 因为有可靠的高手速 所以他的战略就是纯粹堆追猎然后拼操作强压当然这个跟简化成"AI只是会操作"有点微妙的不同但是要说这个不是靠手速...他是靠手速阿
作者: Pegasus99 (天马行空...的天马)   2019-01-25 20:54:00
那就是你只知道表面了 很高兴你自告奋勇的解释
作者: APM99 (血统纯正台北人)   2019-01-25 20:54:00
这跟表面无关 这跟游戏本质有关 这游戏本来就是靠操作
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 20:55:00
我想这边已经辩论过两轮到底怎样了 半途跳出来喊你们不懂呵呵呵
作者: Pegasus99 (天马行空...的天马)   2019-01-25 20:56:00
DeepMind一定要选星海这种复杂度够高的RTS 才能代表他真的有学到东西所谓的DeepMind就是为了跟一般的学习型AI做区分:如果开发团队有照着定义的话 DeepMind是指人类从来没有教他要做什么 甚至不应该给他棋谱/RP 而是单纯让他学习星海是什么样的游戏 告诉她操作方法后 让他自己去跑 也就是
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 20:59:00
好 现在我们明确知道是谁只知道表面了
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:00:00
说DeepMind是在不知道大家怎么玩星海的前提下去打到现
作者: paul012011 (小全)   2019-01-25 21:00:00
k大前面的意思是 因为手速设定的问题 理论上应该要钻研战略的AI一头钻进去生基本兵后疯狂微操
作者: KTZest (P7GAB)   2019-01-25 21:01:00
这个AI打得赢韩国顶尖神族吗?
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:02:00
人类想像的战略 这样不能否定从无到有的这种惊人的自学成果
作者: miha80425 (ohsialay)   2019-01-25 21:03:00
AI没有聪明到会证1+1 他会找最简单的方式解决但是人类想让AI变到会证1+1 而不是直接给2这个答案用这例子解释不会看不懂吧
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:04:00
一个AI为了胜利 从单纯的拼操作 自己学习到原来有"战略"这样的东西 并且实际表现出来 且逼近人类认同的想像这是非常美丽且厉害的事情
作者: qoo60606 (凛)   2019-01-25 21:06:00
内行看门道
作者: Jotarun (forever)   2019-01-25 21:06:00
我理解看了AlphaGo以后有些人希望AlphaStar一样是智取但是系统学出来怎样就是怎样 他们并没有直接去设定
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:07:00
miha的举例我觉得可以 不过正因为星海的难度(或我们称规则)复杂 所以当他能够自学出人们想出的战略时 比起棋类这种容易有最佳解的游戏来说更让人惊艳
作者: paul012011 (小全)   2019-01-25 21:09:00
问题在于 原本AI的APM设定理论上要在人类水准(以下)的结果这次比赛的里已经飙到有点像悍马2000了
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:10:00
举个例子:以往的学习型AI(也是像人类的学习方式) 如果
作者: Jotarun (forever)   2019-01-25 21:10:00
他们并没有特别设定APM
作者: paul012011 (小全)   2019-01-25 21:10:00
AI学习的前提是其他条件要和人类相仿啊
作者: Jotarun (forever)   2019-01-25 21:11:00
他就是从人学来的啊 人不也是平常某个APM 但偶而会飙起来
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:12:00
但deepmind不一样 他的学习方式是:你给他一推设计图 可
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:12:00
再说一次 人类飙上去的APM与AI飙上去的APM不等价
作者: Jotarun (forever)   2019-01-25 21:12:00
这以后他们应该会再看要怎么处理
作者: miha80425 (ohsialay)   2019-01-25 21:13:00
就用卡尔达肖夫类似的说法 AI实现分三阶段
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:13:00
我的意思就是 Deepmind一开始就设计错规格了
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:13:00
子 这时他根本不知道什么是好房子 但她在学习中发现房
作者: Jotarun (forever)   2019-01-25 21:14:00
我再讲一次 没有设计规格
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:14:00
子之间的差异 而且他能推纳出有些是好的有些是坏的 最
作者: miha80425 (ohsialay)   2019-01-25 21:14:00
3.阿发X 特殊最佳解 也就是超越人类
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:15:00
后做出自己的房子
作者: lovinlover (Lovin Lover)   2019-01-25 21:15:00
小色现在在Olimo讲解AlphaStar XD
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:16:00
他就是这里错误好了吗? 他没有规范好边界条件 把所有超过人类合理操作极限的所有模型干掉做出来 对 很强 操作天下第一 但是收敛错了
作者: miha80425 (ohsialay)   2019-01-25 21:16:00
人类文明无法实验到最佳解 资源 金钱实在不够用
作者: qoo60606 (凛)   2019-01-25 21:17:00
别这样 围棋也是超过人类合理思考极限阿 他就是做出超过人类水平的正常发挥嘛
作者: miha80425 (ohsialay)   2019-01-25 21:17:00
要阿发X算出好的方案 再进行实验 这才是AI发展
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:17:00
星海争霸是一个在设计上就透过引入操作性去设计单位交换
作者: Jotarun (forever)   2019-01-25 21:18:00
太早设限才不对 你根本不知道系统出来的结果是怎样
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:18:00
的游戏 忘记这一点讲的天花乱坠根本没有用
作者: miha80425 (ohsialay)   2019-01-25 21:19:00
放心啦 阿发星团队也不会接受这样的结果
作者: Jotarun (forever)   2019-01-25 21:20:00
如果只要APM就赢了那怎么不见其他AI早早用这招?而且现在只是过程而已 一直抓着这点说人家错很奇怪
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:22:00
就我所看到的是 阿法星在deepmind的学习行为下 发明了
作者: Jotarun (forever)   2019-01-25 21:22:00
实际上在训练的过程之中 AlphaStar确实也展现了很多策略一开始只会rush 后来就会农 或者骚扰
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:23:00
营运 产兵 作战 而作战时要使用战术 最后再加上大家诟
作者: qoo60606 (凛)   2019-01-25 21:23:00
你看FB团队没设APM还是打不赢阿(欸
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:26:00
你们根本没认知到 在没有合理规范收敛范围下
作者: aCCQ (阿贤)   2019-01-25 21:26:00
讨论的前题不一样 一个是人机大战公平性 一个是着重学习成果
作者: aCCQ (阿贤)   2019-01-25 21:27:00
你们讨论是没有结果的
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:27:00
对 学习成果很了不起 他是把之前没人解决的模型做出来了但是他实际上解错了东西好吗这个游戏的设计里面就已经先隐藏预定了操作的限制
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:29:00
那是你以为他解错了:他并没有因为知道高APM能够追猎能
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:29:00
单位的伤害输出与血量装甲云云都与这有牵连现在你扔一个超过设计规范的东西下去 那玩的就已经不同了
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:31:00
.........你以为人类真不知道操作完美的追猎可以赢不朽?
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:34:00
知道 但因为不会形成问题所以不会解决这个现象 如果是其他领域呢? 一个没有人为定义或种族平衡的世界 他不能想出人类无法解决的问题的答案吗?
作者: kira925 (1 2 3 4 疾风炭)   2019-01-25 21:37:00
所以我在说 你们想像的星海不是现实人类在打的星海
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:37:00
如果你是因为热爱星海所以看出星海的缺陷 那你完全没有问题但从这场比赛 同时也让看到deepmind的未来
作者: Rex1009 (冬の影)   2019-01-25 21:38:00
你们讲的就两回事 完全没有交集P大觉得我performance变好就能发paper了K大觉得我要买一个solution结果你给我一个我做不到的问题的定义不一样
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:42:00
我会这样解释很简单:因为deepmind不是为了成为星海第一而研发的 他是研发一个超级AI能够解决问题包括星海如果为了解决单一问题而发展AI 就跟前一世代的AI没什么两样了就跟你没办法定义一个从小栽培数学且表现特好的孩子为数学天才 但你可以称略懂基本知识而能解决延伸问题的为天才
作者: Rex1009 (冬の影)   2019-01-25 21:48:00
我相信Deepmind有野心要有一个强AI算法但是AlphaStar的限制条件会被挑战也很正常所以这个project这样肯定是不型的
作者: Pegasus99 (天马行空...的天马)   2019-01-25 21:50:00
老板大怒
作者: lovinlover (Lovin Lover)   2019-01-25 21:53:00
老仙刚刚说了 5:0MANA的系列战是刻意不限制APM
作者: energyy1104 (Bill Wang)   2019-01-25 21:55:00
客服AI听起来超废 大家就是想对活生生的客服狂骂啊
作者: tsairay (火の红宝石)   2019-01-25 23:40:00
这个再发展下去..AI控制的兵器很快就会出现了
作者: miha80425 (ohsialay)   2019-01-26 02:41:00
根据国外一些八卦 google离职员工说不想间接参与战争搞不好早就有了
作者: AMTS   2019-01-26 03:31:00
认真觉得纯粹立场不同 AI开发者其实没很在意输赢只是想观察他表现出来的模式 以现在来说算很有成果了
作者: angeltear15 (嘉明湖)   2019-01-26 10:26:00
事实上就是两年算出 操作>>>>>all不是废到笑是什么?不就跟花几百万研究证明冰箱耗电比较大一样
作者: Jotarun (forever)   2019-01-26 10:50:00
不懂装懂还言之凿凿真可悲先把这个研究的目的搞懂吧
作者: eyesg (彌十郎)   2019-01-26 12:47:00
星海就屁孩游戏 不需要啥智商越年轻手越快越有优势
作者: angeltear15 (嘉明湖)   2019-01-26 13:46:00
麻烦那个所谓懂的人 快去把阿法Go 弄好 我再来推你不然其实也只是死鱼在装高潮 谁比较可悲? 哈
作者: Jotarun (forever)   2019-01-26 14:18:00
都2019了还在Go 先去念点书吧
作者: eyesg (彌十郎)   2019-01-26 14:27:00
这种AI强大在于它没有寿命 你会死 我会死 怎么学习都有归零的一天 悍马2000不会成长更是垃圾但是阿发系列 他们有精神时光屋 只要砸钱在硬件上可以达到非人的学习时间 星海普通玩家打十年 最多15000场 20000场但是他可以一秒数十盘而且他没有寿命 虽然学习的速度跟人类比极慢慢 需要人类帮他调整方向增加效率...但是他永恒不死 目标又又由人类设定未来在军事上 工程上 维护跟管理 将会大幅淘汰人类你觉得垃圾 只是代表你很无知
作者: arrenwu (键盘的战鬼)   2019-01-26 14:32:00
那个前提是AI要能够越来越强啊
作者: micbrimac (shark)   2019-01-27 06:29:00
无知的是让AI练的下去 以后取代人类
作者: juicylove (juicy)   2019-01-27 09:56:00
就没那么容易做到啊 已经进步很多了

Links booklink

Contact Us: admin [ a t ] ucptt.com