Re: [讨论] 对电脑战胜人类的看法

楼主: aaaba (小强)   2016-11-02 13:35:28
分享两个网络看来的想法,有错的地方就算了,不用太认真。
1.地平线效应:
根据zen的开发者的说法,人机第四局末,无理手连发的背后原因,可能
是地平线效应。这个效应是说,阿狗对于目前情势的预想能力有局限,
它判断是蛮准的,不过可能在30手之内神准,30手之后稍微准。所以30
就是阿狗的地平线。试想下列情境,阿狗遭遇一个难局,它现在还在长
考中,目前的考虑过的变化都觉得无解,大概最乐观的是 a-b-c-d-e
这个变化,胜率48%。
忽然,他看到一条相对乐观的变化,w-x-y-...-a-b-c-d-e,胜率51%,
他后来就选了这个变化。只是这个变化的好,是个假象,仅仅是把
a-b-c-d-e 这个变化用一堆先手 w-x-y-z-...推出30步的范围,然后
因为30步以外的胜率估测不太准,就高估到了51%。后来阿狗当然就死得
很难看。当然以后阿狗地平线增加后就不会常常看到阿狗崩溃了。
2.动态贴目:
其实要程式模仿人的行为有点不科学,要阿狗赢棋,你就让它知道怎样
叫赢棋就好,不要再叫它学有的没的,比如说叫它赢多目一点,这往往让
阿狗学坏了,反而赢不了棋。如果真的要学,曾看过有人提过动态贴目的
概念,大概就是一开始有三只阿狗,它们分别是在贴目5.5、7.5、9.5的
环境下学棋的。开局就让7.5的那只下,其他两只就在旁边话修,并且评估
胜率。随着局面演变,如果目前7.5的狗觉得胜率80%,9.5的狗觉得胜率
70%,9.5的狗就会说:滚啦赣,换我来下。这样下去,9.5的狗如果没崩溃
,盘面至少就会赢对手9.5目。(假设狗执黑)
相反的,如果目前局面悲观,7.5的狗觉得前途茫茫,只有45%胜率,决定要
崩溃了,5.5的狗就会说:慢著,我觉得还有50%胜率,先由我接手撑著,等
你之后心情好一点再来继续。之后对手下了个缓著,7.5的狗突然觉得胜率
回到50%,就一脚把5.5的狗踢下主控台,接手棋局。当然了,以上只是虎烂
的,有效没效完全没验证过,当马路消息听听就好。
作者: paulli (paulli)   2016-11-02 14:06:00
可借转弈棋吗? 谢谢!
作者: HeterCompute (异质运算)   2016-11-02 14:08:00
动态贴目的想法有趣,好奇实际成效如何
楼主: aaaba (小强)   2016-11-02 14:08:00
欢迎转录请自取
作者: paulli (paulli)   2016-11-02 14:21:00
谢谢,已转 https://goo.gl/ca1NkQ 与前一讨论并文
作者: Cauchy2008   2016-11-02 20:49:00
有趣的想法
作者: ddavid (谎言接线生)   2016-11-03 02:03:00
1与2事实上都非常合理,特别是1因为AlphaGo特别爱下掉交换的特色,文中推测的理由成立的可能性又更高了2的话,是有价值可以尝试的方向,不过不一定成功
作者: alen332l (alen3321)   2016-11-04 10:03:00
谢谢分享

Links booklink

Contact Us: admin [ a t ] ucptt.com