大家好,
我这几天看了很多资料和文章,
整理了一些关于AlphaGo的常见问题和解答,
希望能减少大家对AlphaGo的误解。
如果认为我写的回答有错,
或还有什么值得编进去的问题,
都欢迎推文告知,
我会尽快修改。
全文连结:
http://roger0123.blogspot.tw/2016/03/alphago.html
全文:
AlphaGo是什么?
AlphaGo是英国DeepMind公司开发的一套围棋AI程式,也是目前(2016年3月)已公开的围棋AI中最强的一个。
由于DeepMind公司已经被Google收购,所以AlphaGo也可以说是“Google的AlphaGo”。
在2015年10月,它以5:0击败了连续三年获得“欧洲围棋冠军杯”冠军的樊麾二段,在2016年1月公开了消息后,引起棋界及学界的注目。
在2016年3月9~15日,它与当时公认最强棋士之一的韩国棋士李世 (或称李世石)进行5局的“人机大战”,目前进行到第4局,由AlphaGo以3:1领先。
AlphaGo的中文名称是?
目前没有官方译名。
比较可能的翻译大概是“阿尔法围棋”,因为“Go”就是“围棋”的英文,而这是从日文音译到英文的。也有各种翻译像是“阿法狗”、“阿尔法狗”、“阿发狗”。
AlphaGo跟其他的围棋AI差在哪里?
最大的差异在于AlphaGo使用了“类神经网络”这个技术,这让AlphaGo拥有媲美职业棋士的“棋感”和“局势判断能力”,目前其他AI都没有如此精确的估算能力。
(“棋感”可以解释成“看盘面就能快速知道下哪些位置可能不错”的能力)
AlphaGo是不是把大量的棋谱存起来,下棋时参考?
不是。
虽然AlphaGo在训练过程中确实有看过大量棋谱,但这些棋谱只被用来调整AlphaGo的参数,没有被存进去。可以这样理解:AlphaGo不是死记棋谱,而是记住其中的应对原则。
棋谱中没出现过的棋形,AlphaGo是不是就无法应对?
不是,但可能应对得比较差。
因为AlphaGo本来就不是死记棋谱,所以就算是跟棋谱不完全一样的棋形,AlphaGo也能大略判断出合适的应手。
而且AlphaGo(或任何围棋AI都)具有“试下接下来的棋步并判断局势”的能力,所以就算AlphaGo没办法只凭过去的经验找出适合的应手,也能即时计算之后的好几步,看哪一手最有可能让它获得优势。
不过如果棋形真的太特殊,导致AlphaGo漏算了某些不容易发现的棋步,就有可能会下得特别差。
为什么AlphaGo这么强?
我认为可以这样想:AlphaGo拥有与职业棋士差不多的“棋感”和“局势判断能力”,又有人类所不及的“运算能力”可以计算接下来数十步的变化,所以能打败人类职业棋士也是不意外的。
AlphaGo有没有弱点?
一种说法是,如果能下出棋谱中极少出现的布局、妙手,出乎AlphaGo的预测,AlphaGo就会很难应对。例如与李世石对弈的第四局中,在李世石下出第78手的妙手之后,AlphaGo之后的几手就下得特别差,很可能就是这样的情况。
这方面说法很多,建议直接看Google搜寻的结果吧!
==关于AlphaGo与李世石的比赛==
AlphaGo在赛前有没有针对李世石做调整?
没有。
在这段采访(英文的)中DeepMind公司的CEO
作者: sadmonkey (下雨天) 2016-03-13 21:43:00
AlphaGO单机跟分布式相关的讯息
作者:
bxxl (bool)
2016-03-13 21:45:00小修正一下,樊麾第五盘就已经有打劫了这个樊麾自己有说,网络上棋谱也可以看到
作者: andylin8707 (新垣是我的) 2016-03-13 21:46:00
推
作者:
scju (QQ)
2016-03-13 21:47:00“由AlphaGo以3:1领先”→这样讲不能说错,但更好的讲法是lphaGo已经确定在五战三胜的系列赛赢了,接下来只是看李世石最后是拿下一局或二局。
不是不能打劫 是不擅长打劫 说真的怎么可能不能打劫 Zen之流的都会打劫了 只是擅不擅长而已
作者:
Marino (马利诺)
2016-03-13 21:53:00固狗 阿法狗 超顺的
作者: EasternAsh (砲灰) 2016-03-13 21:56:00
应该是说电脑判断打结的胜率还有复杂度高 尽量避免电脑没有擅长的概念 他就是照数据模式走而已
就是打劫变化太复杂 会扯太远 让他看不清楚胜率当然阿法狗相对之前的Zen的打劫能力一定也比较强 但是应该比职业顶级高手弱
作者: EasternAsh (砲灰) 2016-03-13 21:59:00
胜利最大化是对的 如果是赢子最大化 会变成招招险棋会变成棋灵王有一集新人赛左为和塔使名人那样
作者:
Uizmp (黑袍法师)
2016-03-13 22:00:00也有可能是现阶段AG归纳出来的结论就是避劫,因为胜率会降低
作者:
H45 (!H45)
2016-03-13 22:00:00第四盘局后问答中有提到AlphaGo赛前训练的棋谱是业余高段棋手
作者: EasternAsh (砲灰) 2016-03-13 22:01:00
电脑不太可能像人类这么弹性去判断何时该执著 冒风险
作者:
H45 (!H45)
2016-03-13 22:01:00跟类神经网络自己跟自己左右互博的棋谱,所以没有针对李世石问答中也提到AlphaGo在五局中都是使用同一个版本的AlphaGo
作者:
bye2007 ( )
2016-03-13 22:05:00大推整理
作者:
Uizmp (黑袍法师)
2016-03-13 22:16:00我是说AG的理解(推测), 不是人类的
作者: EasternAsh (砲灰) 2016-03-13 22:16:00
我是觉得他们可以设定电脑遇到危机后运算开深一点
作者: EasternAsh (砲灰) 2016-03-13 22:17:00
险棋模式 关键时刻允许更花时间去深层大范围的计算
作者:
Uizmp (黑袍法师)
2016-03-13 22:18:00看直播的评论都说, AG这几盘棋盘中有要复杂度减低的倾向
作者: EasternAsh (砲灰) 2016-03-13 22:18:00
他们以后要让电脑自主学习 我建议把棋谱时间也算进去
作者:
bbbtri (cycling)
2016-03-13 23:15:00我想问几个问题 第一是背定石和开局布局算不算背谱?SL network难道只能算是过一下、无涉及“背”的习得人类棋步?你是把“学习”重新定义了吗?另外 , “获胜机率最大化”不该对应“获胜目数最大化”.......因为后者不会是个好参数可能会导致AlphaGo没有弃子的诱敌战术Demis在记者会上回答的有可能并不精确 个人觉得
推。关于AlphaGo对李世石可能调整,要不要补官方回应XD?
作者:
bbbtri (cycling)
2016-03-14 11:27:00请问"根据NN算出落点"是在对战中进行的吗?
To 楼上: 是啊,SL policy, RL value, rollout都是呗
作者:
bbbtri (cycling)
2016-03-14 13:11:00我觉得你在唬弄啊 要value 凭空要怎么value? 又不是乡民把棋谱数据化 再根据这个数据做分析 作出判断的标准 然后就可以公开说AG完全都不用靠棋谱的喔~~ 哈 这种说话技巧也太厉害 没人觉得AG可以在比赛中找到一盘刚好跟正在进行的一样情况的棋局然后照着下 但它要靠数据做分析而数据对电脑来说就是棋谱 好吗!照你的话,你觉得AG把棋谱“用来train neural network,train完就把棋谱扔了”,就可以假装根本没有一个放棋谱的数据库存在?那它一开始是从哪里拿棋谱出来train呢?你的自由心证里吗?我都说没人以为它是拿棋谱出来照着下了,你还硬要再扯到棋谱的定义.....真是无言。就跟你说的更清楚一点,DeepMind的老板在第四局后的记者会讲的很轻巧,说AlphaGo“只用过网络上业余棋手的对局”,这话大有疑问,他们的算法真就那么厉害?!而你在这里还帮他再补一句其实连棋谱的数据库都没有....甚至扯到维基百科 lol
作者:
Severus (小黄)
2016-03-14 15:26:00alphago最近是封闭版本,不会进化。
bbbtri你真的误解了,真要说..他们的算法就是那么厉害人记得棋谱,下棋时举一反三下棋我们可能会称为背如果打完谱忘了,但是从中学到的经验观念加以使用则不是算法不能简单拟人化,但是真要拟人化就是像后者...对了,跟李九段对弈的有1920 CPU+280 GPU,来源维基百科
作者:
bbbtri (cycling)
2016-03-14 16:59:00你以为利用机率来下棋就不涉及"背"吗? 取80%的着手来下或是取20%的着手来下 难道都不算"真接应用"?"直接应用"