: 电脑好似还有一个问题就是落后时下出的各种大亏损无理手。当然可以理解电脑
: 的逻辑就是:这样下你不应我就赢了所以胜率很高,但这对人类是没用的。相对
: 于之前有人假设电脑落后会变更强因为要追回来,目前看起来反而是电脑落后就
: 走远了,因为它的追棋方式对人类来说是毫无意义的只会让自己越亏越多胜机越
: 渺茫。
其实如果我们假想自己是电脑,应该很容易可以理解这样的行为。
在人的世界,当我们发现自己落后时,所用的方法可能是把局面弄的更复杂,
和对手比计算力;可能是采取守势,等对手犯错等等之类的。这些的前题是,
我们知道对手也是人,人在复杂的局面容易犯错,人在慢长的棋局中很难每一
手都下的完美,可能这里亏一点,那里亏一点,最后就被追上了。
电脑呢?“他以为人的思考方式和他一样”,所以,当他发现自己落后时,代
表在他所想的到的变化中,只要对手正确的回应,他都追不回来。
那他觉得对手会犯错吗?
1. 我想到了,为什么他想不到
2. 如果他真的会下错,那在每一种情况下都应该都有可能犯错
=> 如果他每一种都有可能犯错,那我当然下他犯错后我得利最大的
所以我们在第四局会看到这些不可思议的棋。
换句话说,电脑并不知道“这一手很难,他可能想不到”这种事情,对于追回目
数的两种选择:
a) 这一手如果对手应错了我得利 1 目
b) 这一手如果对手应错了我得利 10 目
对人类来说,a 的难度可能远大于 b ,所以我们下 a ,而不去下 b 。
但是这两个选择对电脑来说却是 b > a ,
因为他觉得对手在 a b 两个情况下犯错的机率可能是差不多的。
以上是我对第四盘 87 手开始的解释
(当然他在87手之后还是有比较正常的应手,所以这也不能完美的解释他的行为)