Re: [心得] 围棋AI AlphaGo 之我见

楼主: mathbug (天堂的定义)   2016-03-14 16:18:07
1. 据说 AlphaGo用到的Neuro Network深达13层
有任何稳定性的报告或是说明吗?
2. 围棋的胜败至少包括两种,一种是压着打或是完胜,另一种是反败为胜
AlphaGo的设计应该是循着第一条路线
问题是喂它的千万盘训练用人类棋谱却包含非常多第二类棋谱
反败为胜的棋谱应该非常多用的是胜负手(或是无理手)
不晓得这会不会是AlphaGo昨天崩溃的原因?
3. 以现在AG的能力,它应该可以先归类/分群 将之前训练的棋谱分开
重新训练时只采用第一种压着打或是完胜的棋谱
也许就不会有无理手的出现了 (或数学上 让它的系统参数稳定)
作者: Uizmp (黑袍法师)   2016-03-14 16:19:00
AG设计团队的理念应该是要尽量消除人类的影响因素 (?
作者: dan310546 (00)   2016-03-14 16:20:00
好像有可能
作者: indium111 (#ttyhg)   2016-03-14 16:21:00
所谓的13层应该是指AG的神经网络中的隐藏层有13层吧
作者: agreerga (鸭毛)   2016-03-14 16:22:00
2.3点不会有冲突吗?
作者: birdy590 (Birdy)   2016-03-14 16:22:00
我觉得很多人都想太多了, AlphaGO 根本不是在下围棋
作者: indium111 (#ttyhg)   2016-03-14 16:22:00
中间的参数设定没看到有人介绍过(多数人应该也没兴趣)
作者: aegis43210 (宇宙)   2016-03-14 16:29:00
谁也不知道之后棋谱洗掉的alphaGO会变的如何?希望是成为以宇宙流为主的棋手,但人类就难以模仿
作者: bbbtri (cycling)   2016-03-14 16:41:00
如果算法真的能创造出典范转移 难以模仿也可以哟~~期待今后AlphaGo发展出宇宙流的死活题给大家解
作者: Rinehot   2016-03-14 17:02:00
简单来说昨天ag应该是没有意识到出棋了 才会下ㄧ堆损棋
作者: kafai (猪仔包 PigSonBow)   2016-03-14 17:58:00
3.的话谁来判断呢?2.的话我觉得会有负面影响,但自我学习有机会把那些负面影响扳回来
作者: aaaba (小强)   2016-03-14 20:00:00
3的确是棘手的问题,大数据的labelling,可用value network试试

Links booklink

Contact Us: admin [ a t ] ucptt.com