今天第四战李世石下出了神之一手挖取得了胜利
假设 AlphaGo 可能的弱点就在于没有继续 reinforcement training 的状态下
对于一样的棋局可能会有一样的反应
是不是第五战只要下得跟今天一模一样就会赢了?
因为就算把今天的棋局也让它学习进去,也不过就是几千万盘中的一盘而已
如果没有特别的算法加强今天这盘的权重,对于判断胜率的参数影响应该是微乎其微
像今天第四战李世石开头采取跟第二盘一样的开局, AlphaGo 也是照下
但是李世石在第12手先变招了, 就不晓得 AlphaGo 是不是会对一样的棋局下一样的棋
如果是的话, 那人类打赢 AlphaGo 的最后大绝招可能就是 S/L 大法?