1. 据说 AlphaGo用到的Neuro Network深达13层
有任何稳定性的报告或是说明吗?
2. 围棋的胜败至少包括两种,一种是压着打或是完胜,另一种是反败为胜
AlphaGo的设计应该是循着第一条路线
问题是喂它的千万盘训练用人类棋谱却包含非常多第二类棋谱
反败为胜的棋谱应该非常多用的是胜负手(或是无理手)
不晓得这会不会是AlphaGo昨天崩溃的原因?
3. 以现在AG的能力,它应该可以先归类/分群 将之前训练的棋谱分开
重新训练时只采用第一种压着打或是完胜的棋谱
也许就不会有无理手的出现了 (或数学上 让它的系统参数稳定)