楼主:
hayuyang (Cloud)
2016-03-13 15:42:14如题
大家似乎发现alphago面对变化多或变化少胜率差不多 会倾向选变化少的
那alphago和自己下个几百万盘
alphago会不会永远都选择变化少的呢?
或者说 变化少的他都下习惯了
变化少的一直打反而胜率一直提高
变化多的很少下反而胜率一直降低
他和他自己下会不会导致算法原本的"缺点"(污染)会被放大呢?
自己天生避开劫争
自己跟自己下个一百万场只是让这个避开劫争的倾向变得更加明显?
作者:
kingrichman (silent all these years)
2016-03-13 15:43:00我是认为如果胜率低于50%,就会陷入只能选低于50%的循环,所以越下越糟
作者:
carylorrk (carylorrk)
2016-03-13 15:55:00training data 的 skew 是很基本的概念,不用替专家烦恼这个啦XD
当污染率达到400%,AlphaGo将跟人类一起变成柳橙汁
这是有可能的 但不知道纯净的比较强还是棋谱比较强不过现在可能有大BUG
作者:
wnglon (冷面笑匠)
2016-03-13 16:50:00被提掉那八目是重点 就是因为阿发狗乱下一子导致八目死棋