Re: [心得] 围棋AI AlphaGo 之我见 mathbug PTT批踢踢实业坊

Re: [心得] 围棋AI AlphaGo 之我见

楼主: mathbug (天堂的定义) 2016-03-14 16:18:07

1. 据说 AlphaGo用到的Neuro Network深达13层
有任何稳定性的报告或是说明吗？
2. 围棋的胜败至少包括两种，一种是压着打或是完胜，另一种是反败为胜
AlphaGo的设计应该是循着第一条路线
问题是喂它的千万盘训练用人类棋谱却包含非常多第二类棋谱
反败为胜的棋谱应该非常多用的是胜负手(或是无理手)
不晓得这会不会是AlphaGo昨天崩溃的原因？
3. 以现在AG的能力，它应该可以先归类/分群将之前训练的棋谱分开
重新训练时只采用第一种压着打或是完胜的棋谱
也许就不会有无理手的出现了 (或数学上让它的系统参数稳定)

作者: Uizmp (黑袍法师) 2016-03-14 16:19:00

AG设计团队的理念应该是要尽量消除人类的影响因素 (?

作者: dan310546 (00) 2016-03-14 16:20:00

好像有可能

作者: indium111 (#ttyhg) 2016-03-14 16:21:00

所谓的13层应该是指AG的神经网络中的隐藏层有13层吧

作者: agreerga (鸭毛) 2016-03-14 16:22:00

2.3点不会有冲突吗?

作者: birdy590 (Birdy) 2016-03-14 16:22:00

我觉得很多人都想太多了, AlphaGO 根本不是在下围棋

作者: indium111 (#ttyhg) 2016-03-14 16:22:00

中间的参数设定没看到有人介绍过(多数人应该也没兴趣)

作者: aegis43210 (宇宙) 2016-03-14 16:29:00

谁也不知道之后棋谱洗掉的alphaGO会变的如何？希望是成为以宇宙流为主的棋手，但人类就难以模仿

作者: bbbtri (cycling) 2016-03-14 16:41:00

如果算法真的能创造出典范转移难以模仿也可以哟~~期待今后AlphaGo发展出宇宙流的死活题给大家解

作者: Rinehot 2016-03-14 17:02:00

简单来说昨天ag应该是没有意识到出棋了才会下ㄧ堆损棋

作者: kafai (猪仔包 PigSonBow) 2016-03-14 17:58:00

3.的话谁来判断呢？2.的话我觉得会有负面影响，但自我学习有机会把那些负面影响扳回来

作者: aaaba (小强) 2016-03-14 20:00:00

3的确是棘手的问题，大数据的labelling，可用value network试试

继续阅读

[新闻] 古力评柯洁是网红柯洁庆祝李世石首胜喝醉zkow 从象棋观点看AlphaGO为什么会输ctrl [新闻] Facebook工程师解疑：AlphaGo为什这厉害zkow Re: [转录] “战胜自己”对于AlphaGo而言不只是口号mgdesigner [棋讯] 今晚七点人机大战3.4盘实况mariakoutei [影片] 人机大战第四局，神之一手降临f845652652 Re: [讨论] 人机对战的热潮后，要如何推广围棋呢?kd1523 [闲聊] 中日韩的民间围棋风气盛行度liveforhappy [讨论] 比赛可以看书,有助推广围棋吧?oooo [闲聊] "骇客棋手"? 会有这现象 ?nanlong