Re: [讨论] 对电脑战胜人类的看法 aaaba PTT批踢踢实业坊

Re: [讨论] 对电脑战胜人类的看法

楼主: aaaba (小强) 2016-11-02 13:35:28

分享两个网络看来的想法，有错的地方就算了，不用太认真。
1.地平线效应：
根据zen的开发者的说法，人机第四局末，无理手连发的背后原因，可能
是地平线效应。这个效应是说，阿狗对于目前情势的预想能力有局限，
它判断是蛮准的，不过可能在30手之内神准，30手之后稍微准。所以30
就是阿狗的地平线。试想下列情境，阿狗遭遇一个难局，它现在还在长
考中，目前的考虑过的变化都觉得无解，大概最乐观的是 a-b-c-d-e
这个变化，胜率48%。
忽然，他看到一条相对乐观的变化，w-x-y-...-a-b-c-d-e，胜率51%，
他后来就选了这个变化。只是这个变化的好，是个假象，仅仅是把
a-b-c-d-e 这个变化用一堆先手 w-x-y-z-...推出30步的范围，然后
因为30步以外的胜率估测不太准，就高估到了51%。后来阿狗当然就死得
很难看。当然以后阿狗地平线增加后就不会常常看到阿狗崩溃了。
2.动态贴目：
其实要程式模仿人的行为有点不科学，要阿狗赢棋，你就让它知道怎样
叫赢棋就好，不要再叫它学有的没的，比如说叫它赢多目一点，这往往让
阿狗学坏了，反而赢不了棋。如果真的要学，曾看过有人提过动态贴目的
概念，大概就是一开始有三只阿狗，它们分别是在贴目5.5、7.5、9.5的
环境下学棋的。开局就让7.5的那只下，其他两只就在旁边话修，并且评估
胜率。随着局面演变，如果目前7.5的狗觉得胜率80%，9.5的狗觉得胜率
70%，9.5的狗就会说：滚啦赣，换我来下。这样下去，9.5的狗如果没崩溃
，盘面至少就会赢对手9.5目。（假设狗执黑）
相反的，如果目前局面悲观，7.5的狗觉得前途茫茫，只有45%胜率，决定要
崩溃了，5.5的狗就会说：慢著，我觉得还有50%胜率，先由我接手撑著，等
你之后心情好一点再来继续。之后对手下了个缓著，7.5的狗突然觉得胜率
回到50%，就一脚把5.5的狗踢下主控台，接手棋局。当然了，以上只是虎烂
的，有效没效完全没验证过，当马路消息听听就好。

作者: paulli (paulli) 2016-11-02 14:06:00

可借转弈棋吗? 谢谢!

作者: HeterCompute (异质运算) 2016-11-02 14:08:00

动态贴目的想法有趣，好奇实际成效如何

楼主: aaaba (小强) 2016-11-02 14:08:00

欢迎转录请自取

作者: paulli (paulli) 2016-11-02 14:21:00

谢谢，已转 https://goo.gl/ca1NkQ 与前一讨论并文

作者: Cauchy2008 2016-11-02 20:49:00

有趣的想法

作者: ddavid (谎言接线生) 2016-11-03 02:03:00

1与2事实上都非常合理，特别是1因为AlphaGo特别爱下掉交换的特色，文中推测的理由成立的可能性又更高了2的话，是有价值可以尝试的方向，不过不一定成功

作者: alen332l (alen3321) 2016-11-04 10:03:00

谢谢分享

继续阅读

Re: [讨论] 对电脑战胜人类的看法hioska [棋讯] 第21届三星杯世界围棋公开赛4强 Day3FAlin [新闻] 韩国棋院一把手下台刘昌赫李昌镐上位zkow [棋讯] 第21届三星杯世界围棋公开赛4强 Day2FAlin [新闻] 算不清还是没信心李世石为何错过屠龙 ctrl [棋讯] 第21届三星杯世界围棋公开赛4强 Day1FAlin Re: [讨论] 对电脑战胜人类的看法NewYAWARA [新闻] 三星杯半决赛韩媒体前瞻李世石是最后堡垒zkow Re: [讨论] 对电脑战胜人类的看法joy830 [讨论] 对电脑战胜人类的看法underspin