楼主:
zkow (逍遥山水忆秋年)
2016-03-14 16:31:16其实有个很大的问号,虽然阿尔法对外的更新已经中止
但他自己有学习功能
上一场输给李世石那盘,为了避免劫争而导致崩盘的情形
不知在第五盘时是否会自动修正这个失误?
面对类似选择时,会下别的位置,或勇于打劫呢?
因为有前盘"经验",使他不再重蹈覆辙?
不知电脑自动学习功能是如何,会改变他的棋风跟战略吗?
作者:
shadeel (123)
2016-03-14 16:36:00直接写信去问deepmind阿
谷歌是说这几场比赛期间他们都没有调整过电脑,只有收集数据而已,所以只有依赖自我学习。但又有人说电脑比赛完就停机不动了,自然就没启动自我学习,所以好像有两种说法。
作者:
nangle (帅胖汪汪)
2016-03-14 16:52:00这几天没有自我学习,第五天的版本就是第一天的版本
作者:
Marino (马利诺)
2016-03-14 17:04:00只要不启动权重调整程序就不会学习啦 下几盘都一样
其实这样也不太公平 正常来说要启动学习功能不然高手战个几盘看出破绽就屌打了只是阿法狗前面太猛了所以没人说话
第五盘和第四盘是同版本,没修bug小李拿到赛后资料回馈时就知道了有没有修版本了,韩棋院应该也会希望小李释出他拿到的资料。
作者:
MicroB ( )
2016-03-14 18:08:00自我学习也跟小李下的那几盘没关系 跟看破战无关啦google就说了要针对李世石 一千盘李世时棋谱都远远不够而若是靠左右互博五天就能赢 那根本不用AG 把AG内的RL拉出来就可以了 这东西多算搞不好产生bias棋力还会下降
作者:
doom3 (ⓓⓞⓞⓜ③ )
2016-03-14 18:44:00不然也修一下崩溃乱下啊
作者:
MicroB ( )
2016-03-14 18:54:00如果直接加限制条件就是针对围棋了 deepmind是想展现他们深度学习的强大和适用性 所以连局部死活都不算交给神经网不是只要赢而已 追求的是不同的美感 XD
我记得昨天阿狗输的时候跳出的视窗感觉是说已存盘..
作者:
bxxl (bool)
2016-03-14 20:03:00访问时就有讲了啊,每一场比赛的版本都一样
作者:
papawalk (~自由之翼~)
2016-03-14 23:06:00如果锁版本,反而是小李这几盘成长,阿法狗停止学习XDDD果断猜明天小李赢