[闲聊] alphago和自己下百万棋可能导致自我污染?

楼主: hayuyang (Cloud)   2016-03-13 15:42:14
如题
大家似乎发现alphago面对变化多或变化少胜率差不多 会倾向选变化少的
那alphago和自己下个几百万盘
alphago会不会永远都选择变化少的呢?
或者说 变化少的他都下习惯了
变化少的一直打反而胜率一直提高
变化多的很少下反而胜率一直降低
他和他自己下会不会导致算法原本的"缺点"(污染)会被放大呢?
自己天生避开劫争
自己跟自己下个一百万场只是让这个避开劫争的倾向变得更加明显?
作者: kingrichman (silent all these years)   2016-03-13 15:43:00
我是认为如果胜率低于50%,就会陷入只能选低于50%的循环,所以越下越糟
作者: blacktom (泉)   2016-03-13 15:46:00
这种问题谁知道,就等研发团队测试出来再看看吧
作者: Murasaki0110 (麦当劳欢乐送)   2016-03-13 15:47:00
不会 除非你让他认为输的棋是赢
作者: carylorrk (carylorrk)   2016-03-13 15:55:00
training data 的 skew 是很基本的概念,不用替专家烦恼这个啦XD
作者: jacklin2002   2016-03-13 16:03:00
当污染率达到400%,AlphaGo将跟人类一起变成柳橙汁
作者: mothertime (我超爱傅红雪这变态)   2016-03-13 16:09:00
只要胜率不是0,都有可能回升到50%以上
作者: tn00371115 (二代目月光仙子)   2016-03-13 16:37:00
这是有可能的 但不知道纯净的比较强还是棋谱比较强不过现在可能有大BUG
作者: grimmq427532 (Legend)   2016-03-13 16:49:00
机器学习的的overfitting是老问题了
作者: wnglon (冷面笑匠)   2016-03-13 16:50:00
被提掉那八目是重点 就是因为阿发狗乱下一子导致八目死棋

Links booklink

Contact Us: admin [ a t ] ucptt.com