※ 引述《mathbug (天堂的定义)》之铭言:
: 1. 据说 AlphaGo用到的Neuro Network深达13层
: 有任何稳定性的报告或是说明吗?
论文里有提到它预测的误差
: 2. 围棋的胜败至少包括两种,一种是压着打或是完胜,另一种是反败为胜
: AlphaGo的设计应该是循着第一条路线
: 问题是喂它的千万盘训练用人类棋谱却包含非常多第二类棋谱
: 反败为胜的棋谱应该非常多用的是胜负手(或是无理手)
: 不晓得这会不会是AlphaGo昨天崩溃的原因?
所谓千万盘是自我对奕, 不是人类实战谱, 人类高手实战谱还没那么多.
看它跟小李下的棋路, 是第一种路线多? 还是第二种多?
: 3. 以现在AG的能力,它应该可以先归类/分群 将之前训练的棋谱分开
: 重新训练时只采用第一种压着打或是完胜的棋谱
: 也许就不会有无理手的出现了 (或数学上 让它的系统参数稳定)
中间攻防输掉是 AlphaGo 形势判断错误, 劣势盘面还以为优势继续走损手.
后来左下角的挖被吞吃, 还有点影响到左边黑棋的死活.
理论上决策树会假设对方走最好的一手 (被吞吃), 而不是期待对方犯错.
AlphaGo 有很多其他的着手选择, 下起来都没有那一手损导致胜率更低.
就算以 AI 的角度, 我也看不懂它在下什么.
难不成 AlphaGo 大幅落后时策略改成期待对方应错翻盘?