Re: [心得] AI对战人类心得(已补影片)

楼主: x94fujo6   2017-11-04 08:02:45
想说的有点多
如果版主觉得不适合发在本版可以删除 没意见
每次有AI相关的东西
就会发现很多人的观念还停留在上个世纪
以为AI就是写好写死的固定程式
这次比赛的AI
前两个应该是属于上面这种
第三个AI很明显有点类似AlphaGo
有一些比较"非人类"的动作
10年前跟你说AI可以打赢围棋世界冠军
99%的人都会笑着说怎么可能
现在?
目前最好的AI
所做的各种判断/应对
都不是由人类设计/输入/写好的
而是由AI自己不断"演化"的结果
所以会有一些"非人类"操作是非常正常的事情
不懂的可以看看这影片
我下面会说明
只要几分钟你就能大概理解这种AI
https://www.youtube.com/watch?v=NHtsUls3AnY
这是一个超级简单到不行的AI模拟
首先
所有AI都拥有一样的 "身体"
但每个AI都有自己的移动方式
这个方法最一开始是随机设定的
所以会有很多根本不知道在干三小的AI 很正常
再来是这种AI的关键
演化的条件
要设定什么条件才能演化出更"好"的AI
在这个模拟中
要的是能够尽可能的快速吃到 "食物"(红点) 的AI
当一个AI能够吃到食物就能产生基于自己的 "后代"
一直吃不到/抢不赢的...就是死亡/淘汰
"后代" 虽然大部分的移动方式和 "前代" 一样
但会有一些小部分可以产生随机的变化
(想成DNA复制错误产生的突变就懂了)
这个变化可能有好有坏
能更快的吃到食物→ 这个AI就能产生更多的"后代"
反而动作变慢→ 这不好的演化结果会慢慢被前者淘汰
最后
你会得到一群抢食物快得吓人的AI
这跟大自然的物竞天择有87%像
"自然演化" 就是一个非常强大的算法
可以想成类似暴力破解
尝试近乎无数的可能性后找出好的解法

"演化" 和 "暴力破解" 最大的不同在于
演化并不需要每一次尝试都 "从0开始"
而是建立在"前代"的成功之上逐渐改进
最后的结果可能不是真正最好的解决方法
但至少非常非常非常接近
这种AI的特性是
里面到底发生了啥
就算是设计的人都得研究一下才能知道
而且也只是"当下"的情况
多跑几次模拟后可能又不一样了
对外界来说就是个 "黑箱"
就像电脑自己教会自己一样 (基本上 真的是)
https://www.youtube.com/watch?v=op0bhZNUJFE
这个内部运作的程式
应该也是模拟出来的AI
四只脚=同时协调大量元件运作
受到外力能自行恢复平衡
加上负载后重心变化后要怎么应对
人写的出来你敢信?
随便一个动作就要花很多时间
而且87%无法动的和AI一样完美
AI模拟连实机都不需要
直接在电脑上一次模拟数十数百个
不需要人介入(其实还是要 调整各种条件等等)
就能自己演化出来
参数设的好 → AlphaGo
参数设的不好 → 垃圾/改参数重来
只会4D的AI
很可能是因为天梯环境
天梯在干嘛?
不就是以最高胜率的战术获得最多胜场?
当AI发现4D胜率很高然后只以这个战术为基准的时候
整个训练方向就错了
如果训练AI时用的是职业选手
那结果应该会很不一样
https://www.youtube.com/watch?v=hx_bgoTF7bs
这个也是
初期看起来真的很好笑 (有如这次表演的AI)
但理论上演化够多次后
AI会比 "你" 还懂得如何 "正确的" 走路...
纯粹分享一些业余的知识
如有错误欢迎讨论
作者: capssan (Miracle)   2017-11-04 08:24:00
这算是类神经的概念吗 好奇问一下而已
作者: jayfrog (寫不出coding)   2017-11-04 08:26:00
演化计算是ai的一种没错,但是不是每种ai都是演化计算吧
作者: jackfantasy (jackfantasy)   2017-11-04 08:29:00
1楼是的 现在大部分AI都有类神经网络在里面 也就是常听到的neural network其实对AI来说 所谓的学习 是去逼近如果你愿意相信 则其实世界上所有的事物都可以转化对应成一个数学函数 可能很复杂 可能很简单y=ax+bAI的概念就是我不知道a,b但是我从一堆资料里面去逼近出a,b是什么 学到这个f(x)然后接下来你给我x我一定可以预测出y所以才说训练资料很重要 如果你的训练资料有偏颇 或是太少 他根本无法逼近出真正的那个f(x) 就会变成预测很烂 很不准 或是打很烂 但这就是他从资料中学到的类神经也就是neural network 做的就是我用一堆神经元来让AI可以逼近超复杂 不只是a b两个参数 而是上万个参数的函数
作者: sartan (sartan)   2017-11-04 08:40:00
Festo这是什么公司阿?也太可怕,默默开放出这些可怕玩意
作者: capssan (Miracle)   2017-11-04 09:02:00
如果是这样 围棋跟星海对他们来说资料量差太大了吧几乎多个参数就多好几倍的变化
作者: jackfantasy (jackfantasy)   2017-11-04 09:10:00
星海跟AlphaGo用的呢是neural mdtwork的一个分支 叫做reinforcement learning 强化学习一样是逼近找出数学函数 但是这个数学函数表示的是一个叫做“决策”的条件机率 也就是AI“观察”到现在这个“状态” 然后决定要做什么“动作”每一个“动作”会得到“奖励” 目标是使得整局比赛奖励最大对啊 这参数量真的很大 因此要在学习过程懂得删减掉机率太小的决策以减少计算 而且训练过程需要的电脑数量至少几千几万台 时间也要四、五个月
作者: Timba (踢音霸)   2017-11-04 10:17:00
学习能力啦~ 还有逻辑判断 能不能用现有的资讯预测其他状况
作者: kirimaru73 (雾丸)   2017-11-04 10:33:00
参数量超超超超大 所以之前的年代这不是主流作法现在因为GPU强到翻 大家发现它足以撑起这么夸张的计算量所以才一窝蜂开始发展现在的这种作法 是真的相当于在开发一颗大脑出来但这颗大脑确实只会做一种事情(然而也可以干爆人类)所以要说这是弱人工智能并非真的智慧 也是有其道理推文提到的ax+b就是类神经网络的 但十几年前的技术大概只会使用1024/2048这种量级的ax+b所以被当成玩具现在则是约100x100x1000+4096+4096这种程度的数量另外如果考虑AI竞赛或人机大战 没人规定你不能用脚本你有本事就用 只是现在用了会被业余玩家干爆而已(游戏内脚本强是因为他作弊)
作者: sampp1213205 (佛朗Sam哥)   2017-11-04 18:55:00
然而 依然一堆原始人在小看Ai
作者: x61s (x61series)   2017-11-04 19:54:00
楼上最好说清楚点,Sen应该不算原始人,AI行为搞笑自然会被放大检视甚至轻视,现在轻视也不代表会一直轻视
作者: win4104 (BB)   2017-11-04 20:33:00
现在明明就还有很多问题待克服我不觉得把将来的可能性拿到现在来反对其他人对当前成果的批判 是什么有意义的事
作者: kirimaru73 (雾丸)   2017-11-04 20:44:00
这一版AI被笑是完全合情合理的 4D+2这种战术以玩家的角度来看本来就该笑 当然会长成这种战术确实有研究上的原因和讨论价值 不过SEN他播报是播给游戏玩家看的那当然要站在玩家的立场来解说 没什么好批评的
作者: sampp1213205 (佛朗Sam哥)   2017-11-04 20:48:00
白痴 在讲的是小看ai的可能性跟强大好爆zzz
作者: kirimaru73 (雾丸)   2017-11-04 20:49:00
哗 不服气就砲白痴 这点真的比AI强太多了
作者: x61s (x61series)   2017-11-04 20:54:00
我们已经进入网络时代,资讯交流是以秒为单位传递今天嘲笑AI的人 在AI蜕变后 往往也是最早赞扬AI的人
作者: win4104 (BB)   2017-11-04 20:57:00
再说 虽然在很多篇已经说过了DeepMind最近发表的研究状况是他们卡关了为什么还是看到很多人讲的好像 算法问题都已经解决只需要给AI时间学习一样
作者: x61s (x61series)   2017-11-04 20:58:00
无需以先知者的态度来讽刺,这个时代没有先知,人人都是先知
作者: Butcherdon (Donald)   2017-11-04 21:01:00
好像以前摸过的基因算法不过那时候休课只是入门 没接触复杂度 设定好进化条件和突变种类之类的东西 让程式演化n代自动找出某种棋盘排列 人很难排出的东西 电脑只要两三秒
作者: jackfantasy (jackfantasy)   2017-11-04 23:13:00
其实笑是正常的 如果身为懂AI的人更该高兴 因为你正在目睹市场被教育Google DeepMind比起征服围棋有另一个更大的重点跟使命-教育市场 为未来的AI产业开拓市场 越多人了解AI本质 就越能接受他 使用他 为他付费Google更是在大家都不懂AI是什么时 透过征服围棋 让大家有了Google是AI产业领导品牌的形象比起下围棋 这是更大的一步棋所以何必笑或是生气外人看不懂AI 当你是第一个教育市场的人 你就赚钱了 这也许是台湾产业和专家、工程师该学的
作者: x61s (x61series)   2017-11-05 00:13:00
很简单 因为说的人往往非产业中人 酸民很少是深度涉入者ai是否被接受 这些酸民都只能旁观 选择当先知酸人相对实际
作者: APM99 (血统纯正台北人)   2017-11-05 06:12:00
不小看这次AI的 叫做对AI有太多幻想好久没看到白痴这两个字了 好猛3b1b 这几天把AI的视频也都给丢上youtube了 有兴趣了解的这些AI天梯胜率有达到70%吗 天梯有前十吗 没有嘛还有连单位都不用圈选的 根本作弊 就搞笑来的还请到司令出征wwwww
作者: ernova831   2017-11-05 11:29:00
连新手都打不赢的采矿AI到底能干嘛zzz
作者: jackace (inevitable......)   2017-11-05 12:32:00
我觉得先弄懂MDP和POMDP的limit在哪里再说吧
作者: iamten (小腾)   2017-11-05 15:59:00
这ai打一人般胜率很高 4d战术很强 一般人不会对应打职业就吃屎吧靠硬操作赢的那种也不叫AI还有AI算法很早就有了 这几年强是硬件进步了但是星海是动态 跟围旗是静态完全不一样

Links booklink

Contact Us: admin [ a t ] ucptt.com