[心得] Alphago的弱点

楼主: cscscscs22 (QQQ)   2016-03-13 18:39:41
http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works
Shou-de Lin Facebook上面最新的文章(一直判定广告网站不能贴)
这里有讲alphago的怎么运作的
"反而利用过去学到的policy 结合了蒙地卡罗树状搜寻(MCTS)的方法找出最好棋步"
"必须要能够走出前所未见的局面,降低它对于盘面估测的准确度才会有机会"
可以解释为什么在李九段下出神之一手后就开始秀逗了
alphago利用过去棋谱和不断自我训练得一个函数
加上蒙地卡罗树状搜寻 来模拟最好的棋步
因为这神之一步是alphago在这几千万局中完全没模拟到的一步
导致模拟全部重来所以之后几步都下出低级失误
弱点非常清楚下出alphago没想出的一步
不过这一步的机会只能用一次
但是因为alphgo能一直不断学习
这棋谱加入数据库后同样的手法就没用了
所以第五局除非李九段可以下出和今天一样的神之一手不然没有机会赢
问题是根本不知道alphago哪些是它下过、哪些是它没下过的
作者: qweewqq (風一樣的男子)   2016-03-13 18:40:00
其实最有趣的是Alphago不知他在下棋XD
作者: louiswoman (匈奴夫人)   2016-03-13 18:41:00
圣斗士表示:
作者: cksxxb123 (maxwell)   2016-03-13 18:41:00
希望阿法狗是萝莉
作者: NaoGaTsu (那欧卡兹)   2016-03-13 18:41:00
这是误解吧,每一手AG都是独立模拟计算,没有全部重来的说法?应该是形势判断的逻辑编写上有问题。
作者: umano (ぎゃああああああああ)   2016-03-13 18:42:00
希望周二能再现奇蹟
作者: zkow (逍遥山水忆秋年)   2016-03-13 18:45:00
我觉得这次李世石在棋界重返颠峰
作者: Ethical (游志杰)   2016-03-13 18:48:00
神之一手!?
作者: MK12 (MK)   2016-03-13 18:49:00
如果他下场顺序放法都一样,也会赢,因为alpha还没修正,但李不会这样做,就是了
作者: zkow (逍遥山水忆秋年)   2016-03-13 18:51:00
应该是有很多选择可以下,不一定会一样吧就算你跟一般电脑玩,也不太可能按部就班每次就会一样
作者: qaaz (hiromi)   2016-03-13 18:52:00
这盘棋只是他千万模型的一个,要影响整个学习成果还早
作者: birdy590 (Birdy)   2016-03-13 19:17:00
这隐含的意义是过去以人类棋谱为主的训练有问题也难怪已经计画好要砍掉重练了
作者: Marino (马利诺)   2016-03-13 19:18:00
神个蛋 感觉狗狗被调过了 显然deepmind不想太招遥全败太难看 让一下输一场较好 那么低级的失误谁相信
作者: liaon98 (liaon98)   2016-03-13 19:23:00
两方输了都有人不相信崩溃 板上也不少
作者: profyang (prof)   2016-03-13 19:25:00
果然出现了XDD 我就知道有人会说阿发够被调过 这跟之前怀疑保密协定是有啥两样
作者: DemonElf (LdsFish)   2016-03-13 19:26:00
推"liaon98: 两方输了都有人不相信崩溃"XDDD
作者: Tenging (菜鸟)   2016-03-13 19:30:00
alphago以为自己在算数学呢
作者: jyhfang   2016-03-13 19:31:00
进化过的阴谋论吗 XD
作者: HamalAri (哈马‧阿里)   2016-03-13 19:52:00
MK12 乱说,MC 每次算出的机率又不会一样
作者: Wishmaster ( )   2016-03-13 19:53:00
阿法沟的下法有玩过电脑围棋的应该都看过,只是他是阿发沟,怎么会犯这种低级失误 XDDDDDD
作者: DemonElf (LdsFish)   2016-03-13 19:58:00
我觉得现在在讲Alphago低级失误的跟前三盘在讲李失误的的不觉得有即视感吗?他之所以没下出好棋是因为对手逼出
作者: smallyuki (smallyuki)   2016-03-13 20:00:00
只能推liaon98了...不知道后天又是哪一方崩溃XDD
作者: DemonElf (LdsFish)   2016-03-13 20:01:00
来的,就像Google说明了AI到87步发觉了79步开始下错了而79步之后的局面是因为李78步的绝妙好棋造成的
作者: Wishmaster ( )   2016-03-13 20:08:00
我不是指误算喔,我是指必死棋还补一手和下那种低段才会下的死活棋. 不过也很合理,电脑只会想赢,他哪知道对手实力来决定对方最简单的死活是否会出错...
作者: agario (Agar.io)   2016-03-13 20:22:00
其实看过这篇就多半会怀疑AlphaGo的 value net 偶尔会错了http://goo.gl/3qzyIv <- 奇怪的图片偶而骗过 netAlphaGo 就是把棋盘当成图片喂给类似上面文章的 net
作者: Cadd (C+)   2016-03-13 20:33:00
真的, 那步棋就是全场狐疑怎么会下在那边以篮球比喻, 失误可能是投球没进或运球掉球而那手就好像AlphaGo拿球跑去投自己篮送你分不过这也说明人跟AI的差别, 重要决定还是不能只由AI决定
作者: plaxtic (zuke)   2016-03-14 08:21:00
Alphago没有数据库 是靠不停得自我修正程式

Links booklink

Contact Us: admin [ a t ] ucptt.com