Re: [心得] AI对战人类心得(已补影片) x94fujo6 PTT批踢踢实业坊

Re: [心得] AI对战人类心得(已补影片)

楼主: x94fujo6 2017-11-04 08:02:45

想说的有点多
如果版主觉得不适合发在本版可以删除没意见
每次有AI相关的东西
就会发现很多人的观念还停留在上个世纪
以为AI就是写好写死的固定程式
这次比赛的AI
前两个应该是属于上面这种
第三个AI很明显有点类似AlphaGo
有一些比较"非人类"的动作
10年前跟你说AI可以打赢围棋世界冠军
99%的人都会笑着说怎么可能
现在?
目前最好的AI
所做的各种判断/应对
都不是由人类设计/输入/写好的
而是由AI自己不断"演化"的结果
所以会有一些"非人类"操作是非常正常的事情
不懂的可以看看这影片
我下面会说明
只要几分钟你就能大概理解这种AI
https://www.youtube.com/watch?v=NHtsUls3AnY
这是一个超级简单到不行的AI模拟
首先
所有AI都拥有一样的 "身体"
但每个AI都有自己的移动方式
这个方法最一开始是随机设定的
所以会有很多根本不知道在干三小的AI 很正常
再来是这种AI的关键
演化的条件
要设定什么条件才能演化出更"好"的AI
在这个模拟中
要的是能够尽可能的快速吃到 "食物"(红点) 的AI
当一个AI能够吃到食物就能产生基于自己的 "后代"
一直吃不到/抢不赢的...就是死亡/淘汰
"后代" 虽然大部分的移动方式和 "前代" 一样
但会有一些小部分可以产生随机的变化
(想成DNA复制错误产生的突变就懂了)
这个变化可能有好有坏
能更快的吃到食物→ 这个AI就能产生更多的"后代"
反而动作变慢→ 这不好的演化结果会慢慢被前者淘汰
最后
你会得到一群抢食物快得吓人的AI
这跟大自然的物竞天择有87%像
"自然演化" 就是一个非常强大的算法
可以想成类似暴力破解
尝试近乎无数的可能性后找出好的解法
但
"演化" 和 "暴力破解" 最大的不同在于
演化并不需要每一次尝试都 "从0开始"
而是建立在"前代"的成功之上逐渐改进
最后的结果可能不是真正最好的解决方法
但至少非常非常非常接近
这种AI的特性是
里面到底发生了啥
就算是设计的人都得研究一下才能知道
而且也只是"当下"的情况
多跑几次模拟后可能又不一样了
对外界来说就是个 "黑箱"
就像电脑自己教会自己一样 (基本上真的是)
https://www.youtube.com/watch?v=op0bhZNUJFE
这个内部运作的程式
应该也是模拟出来的AI
四只脚=同时协调大量元件运作
受到外力能自行恢复平衡
加上负载后重心变化后要怎么应对
人写的出来你敢信?
随便一个动作就要花很多时间
而且87%无法动的和AI一样完美
AI模拟连实机都不需要
直接在电脑上一次模拟数十数百个
不需要人介入(其实还是要调整各种条件等等)
就能自己演化出来
参数设的好 → AlphaGo
参数设的不好 → 垃圾/改参数重来
只会4D的AI
很可能是因为天梯环境
天梯在干嘛?
不就是以最高胜率的战术获得最多胜场?
当AI发现4D胜率很高然后只以这个战术为基准的时候
整个训练方向就错了
如果训练AI时用的是职业选手
那结果应该会很不一样
https://www.youtube.com/watch?v=hx_bgoTF7bs
这个也是
初期看起来真的很好笑 (有如这次表演的AI)
但理论上演化够多次后
AI会比 "你" 还懂得如何 "正确的" 走路...
纯粹分享一些业余的知识
如有错误欢迎讨论

作者: capssan (Miracle) 2017-11-04 08:24:00

这算是类神经的概念吗好奇问一下而已

作者: jayfrog (å¯«ä¸å‡ºcoding) 2017-11-04 08:26:00

演化计算是ai的一种没错，但是不是每种ai都是演化计算吧

作者: jackfantasy (jackfantasy) 2017-11-04 08:29:00

1楼是的现在大部分AI都有类神经网络在里面也就是常听到的neural network其实对AI来说所谓的学习是去逼近如果你愿意相信则其实世界上所有的事物都可以转化对应成一个数学函数可能很复杂可能很简单y=ax+bAI的概念就是我不知道a,b但是我从一堆资料里面去逼近出a,b是什么学到这个f(x)然后接下来你给我x我一定可以预测出y所以才说训练资料很重要如果你的训练资料有偏颇或是太少他根本无法逼近出真正的那个f(x) 就会变成预测很烂很不准或是打很烂但这就是他从资料中学到的类神经也就是neural network 做的就是我用一堆神经元来让AI可以逼近超复杂不只是a b两个参数而是上万个参数的函数

作者: sartan (sartan) 2017-11-04 08:40:00

Festo这是什么公司阿？也太可怕，默默开放出这些可怕玩意

作者: capssan (Miracle) 2017-11-04 09:02:00

如果是这样围棋跟星海对他们来说资料量差太大了吧几乎多个参数就多好几倍的变化

作者: jackfantasy (jackfantasy) 2017-11-04 09:10:00

星海跟AlphaGo用的呢是neural mdtwork的一个分支叫做reinforcement learning 强化学习一样是逼近找出数学函数但是这个数学函数表示的是一个叫做“决策”的条件机率也就是AI“观察”到现在这个“状态” 然后决定要做什么“动作”每一个“动作”会得到“奖励” 目标是使得整局比赛奖励最大对啊这参数量真的很大因此要在学习过程懂得删减掉机率太小的决策以减少计算而且训练过程需要的电脑数量至少几千几万台时间也要四、五个月

作者: Timba (踢音霸) 2017-11-04 10:17:00

学习能力啦~ 还有逻辑判断能不能用现有的资讯预测其他状况

作者: kirimaru73 (雾丸) 2017-11-04 10:33:00

参数量超超超超大所以之前的年代这不是主流作法现在因为GPU强到翻大家发现它足以撑起这么夸张的计算量所以才一窝蜂开始发展现在的这种作法是真的相当于在开发一颗大脑出来但这颗大脑确实只会做一种事情(然而也可以干爆人类)所以要说这是弱人工智能并非真的智慧也是有其道理推文提到的ax+b就是类神经网络的但十几年前的技术大概只会使用1024/2048这种量级的ax+b所以被当成玩具现在则是约100x100x1000+4096+4096这种程度的数量另外如果考虑AI竞赛或人机大战没人规定你不能用脚本你有本事就用只是现在用了会被业余玩家干爆而已(游戏内脚本强是因为他作弊)

作者: sampp1213205 (佛朗Sam哥) 2017-11-04 18:55:00

然而依然一堆原始人在小看Ai

作者: x61s (x61series) 2017-11-04 19:54:00

楼上最好说清楚点，Sen应该不算原始人，AI行为搞笑自然会被放大检视甚至轻视，现在轻视也不代表会一直轻视

作者: win4104 (BB) 2017-11-04 20:33:00

现在明明就还有很多问题待克服我不觉得把将来的可能性拿到现在来反对其他人对当前成果的批判是什么有意义的事

作者: kirimaru73 (雾丸) 2017-11-04 20:44:00

这一版AI被笑是完全合情合理的 4D+2这种战术以玩家的角度来看本来就该笑当然会长成这种战术确实有研究上的原因和讨论价值不过SEN他播报是播给游戏玩家看的那当然要站在玩家的立场来解说没什么好批评的

作者: sampp1213205 (佛朗Sam哥) 2017-11-04 20:48:00

白痴在讲的是小看ai的可能性跟强大好爆zzz

作者: kirimaru73 (雾丸) 2017-11-04 20:49:00

哗不服气就砲白痴这点真的比AI强太多了

作者: x61s (x61series) 2017-11-04 20:54:00

我们已经进入网络时代，资讯交流是以秒为单位传递今天嘲笑AI的人在AI蜕变后往往也是最早赞扬AI的人

作者: win4104 (BB) 2017-11-04 20:57:00

再说虽然在很多篇已经说过了DeepMind最近发表的研究状况是他们卡关了为什么还是看到很多人讲的好像算法问题都已经解决只需要给AI时间学习一样

作者: x61s (x61series) 2017-11-04 20:58:00

无需以先知者的态度来讽刺，这个时代没有先知，人人都是先知

作者: Butcherdon (Donald) 2017-11-04 21:01:00

好像以前摸过的基因算法不过那时候休课只是入门没接触复杂度设定好进化条件和突变种类之类的东西让程式演化n代自动找出某种棋盘排列人很难排出的东西电脑只要两三秒

作者: jackfantasy (jackfantasy) 2017-11-04 23:13:00

其实笑是正常的如果身为懂AI的人更该高兴因为你正在目睹市场被教育Google DeepMind比起征服围棋有另一个更大的重点跟使命-教育市场为未来的AI产业开拓市场越多人了解AI本质就越能接受他使用他为他付费Google更是在大家都不懂AI是什么时透过征服围棋让大家有了Google是AI产业领导品牌的形象比起下围棋这是更大的一步棋所以何必笑或是生气外人看不懂AI 当你是第一个教育市场的人你就赚钱了这也许是台湾产业和专家、工程师该学的

作者: x61s (x61series) 2017-11-05 00:13:00

很简单因为说的人往往非产业中人酸民很少是深度涉入者ai是否被接受这些酸民都只能旁观选择当先知酸人相对实际

作者: APM99 (血统纯正台北人) 2017-11-05 06:12:00

不小看这次AI的叫做对AI有太多幻想好久没看到白痴这两个字了好猛3b1b 这几天把AI的视频也都给丢上youtube了有兴趣了解的这些AI天梯胜率有达到70%吗天梯有前十吗没有嘛还有连单位都不用圈选的根本作弊就搞笑来的还请到司令出征wwwww

作者: ernova831 2017-11-05 11:29:00

连新手都打不赢的采矿AI到底能干嘛zzz

作者: jackace (inevitable......) 2017-11-05 12:32:00

我觉得先弄懂MDP和POMDP的limit在哪里再说吧

作者: iamten (小腾) 2017-11-05 15:59:00

这ai打一人般胜率很高 4d战术很强一般人不会对应打职业就吃屎吧靠硬操作赢的那种也不叫AI还有AI算法很早就有了这几年强是硬件进步了但是星海是动态跟围旗是静态完全不一样

继续阅读

[外絮] 2017 Road to BlizzCon #10 Elazergn02064109 [情报] Blizzcon 宣布星海争霸2免费cras4202tw [情报] 星海免费 (BlizzCon相关资讯)cody880528 [公告] hclstarkid 水桶一个月gn02064109 Re: [心得] AI对战人类心得linbasohigh [心得] AI对战人类心得(已补影片)sartan [发钱] 2017 WCS Global Finals 乐透游戏TFsonG [实况] Maruhancockk [公告] 回朔文章处理方式 (13:30 修复完毕)gn02064109 [外絮] 2017 Road to BlizzCon #14 SpeCialgn02064109