Re: [讨论] 李世石 VS AlphaGo 第二局看法

楼主: ilw4e (可以吃吗?)   2016-03-11 15:56:50
看很多不下棋的在那边放话好像电脑每一步都是对的,觉得可以细想一下程式的原
理,毕竟目前的程式离真理还是有很大的差距的。我也只是个十几年前的业四,也
不敢说要评棋,但一些简单好坏应该还是可以讲讲。
棋类不像POKER、麻将、或扑克牌游戏是机率游戏,棋类很多地方是有唯一解的。用
死活诘棋当例子,如果电脑真的只是用机率判断,胜率最高的那点可能是:
[对手应的若是那唯一解电脑必死,下其他任何点电脑都活,胜率99%]
电脑应该选择这变化吗?当然不该!
当然我相信AG程式里会对必胜必败的点做排除(不然可能连简单攻杀都会出错),但
我只是强调AG用所谓"最高胜率"判断落子的策略也正是目前电脑应该还可以被击败
的原因。越早期的着手你要用胜败机率来判断越是困难,也很好理解为什么电脑前
期容易出现恶棋。
柯洁讲话那么托大我觉得也是有原因的(当然我觉得他来下也不见得会赢),就是因
为电脑还是有出现明显的坏棋。AG有些疑问手有可能是好棋,像11虎完13手拔,或
37尖冲这种过去普遍觉得不太好的,也许事实上并不太亏。
(解释给X日棋迷:通常13要手拔不会先虎,因为那会把棋下重容易被攻。尖冲通常
认为对方若在3路你尖冲合理,对方在4路你让人4路围空通常是亏的,也就是为什
么评论会认为小李怎样都该往4路那边压而不该实战往5路压)
但43黏到61是黑不好的型这应该是没什么争议的。若实战李没有之后几个缓手让黑
下到73,而是早一步攻击那块弱棋,那应该会是白主动的局面。换个方向想,电脑
中间那坨单官下半天最后还要多花一手73来连回,想也知道不可能好。
因为棋不是机率游戏,但电脑是用机率来判断,因此人若能把握这点下出局部最佳
解应是可以在占些便宜的。
作者: wen17 (祭祀风的人类)   2016-03-11 15:58:00
电脑资源不是无限 而电脑判断计算难易的方法也跟人不同所以可能有部分落子人来看很容易计算出优劣 电脑很难
作者: sky0302 (free)   2016-03-11 15:58:00
本来就是这样了 电脑又不是神 只要有失误就会输
作者: arnold3 (no)   2016-03-11 15:59:00
电脑每一步大概都只有5成多把握而已 强就强再不会失常而
作者: wen17 (祭祀风的人类)   2016-03-11 15:59:00
以上优劣说的是局部可以算出绝对优劣的地方.
作者: arnold3 (no)   2016-03-11 16:00:00
来个天才型的高手把把都出妙手 电脑自然越下胜率越低不需要跟电脑拼计算 用大局意识跟电脑玩
作者: ggoutoutder (女朋友的左手)   2016-03-11 16:02:00
真的很多不懂围棋的在那边自以为 连叫吃是什么都不知
作者: liaon98 (liaon98)   2016-03-11 16:05:00
电脑后面盘面越窄 精确率会越高 人类只有前期有机会
作者: aaaba (小强)   2016-03-11 16:09:00
你讲的就是李喆说的,电脑欠缺逻辑论证的推理
作者: notmuchmoney (真的不错....)   2016-03-11 16:09:00
AlphaGO大局观还是不错 能够在这上面赢过AlphaGO还很难说
作者: Max11 (从来没有)   2016-03-11 16:10:00
职业棋士的比赛,如果最后靠对方犯错获胜,那也不是值得记录的名局。本来围棋的胜负就是要全部都是合理应手。
作者: tomic (细推物理须行乐)   2016-03-11 16:12:00
推 中肯!
作者: AmuroRay (联邦の白き流星)   2016-03-11 16:15:00
没人在怀疑你说的那些地方AG有问题 关键是中前盘看似不1好的棋到底有没有不好 另外一方面 李喆也推测 这种逻辑上就证明不好的选择 可能随着局势越紧张接近而越少会作出
作者: wen17 (祭祀风的人类)   2016-03-11 16:17:00
多赚一目的价值会随着局势僵持紧张甚至劣势=而变大而之后需要负担的计算复杂度(风险)是固定的
作者: shellpig (贝壳)   2016-03-11 16:18:00
其实我觉得现在很大一个点就是,人类觉得的好坏,似乎
作者: sky0302 (free)   2016-03-11 16:18:00
问题就是当电脑在布局下出怪手 小李并没有去反击
作者: wen17 (祭祀风的人类)   2016-03-11 16:18:00
所以说够僵持的时候"推测"可能就不会出这些看起来有问题的
作者: tonyselina (叫声拔拔)   2016-03-11 16:19:00
你第一行哪来的? 几乎没人这样讲
作者: notmuchmoney (真的不错....)   2016-03-11 16:19:00
如果前两盘是针对AlphaGO可能的弱点 而下出有别以往的策略/棋风 那在0:2下 后三盘我也认为该回到合理的应手
作者: sky0302 (free)   2016-03-11 16:19:00
所以根本也无法说那些是好棋 反正人类还是不会学电脑的棋
作者: goldduck (哥达鸭)   2016-03-11 16:19:00
好棋是慢慢累积的 坏棋是后面无法挽回的
作者: wen17 (祭祀风的人类)   2016-03-11 16:19:00
我不算懂围棋 只看了柯直播柯一直说李下的很怪 不像平常的李会扯到劫也是说打劫去拼九死一生不打劫去拼十死无生 只是局面不会整个崩这样输
作者: chordate (封侯事在)   2016-03-11 16:21:00
问个白痴问题,AlphaGo的型不好那么显而易见
作者: wen17 (祭祀风的人类)   2016-03-11 16:21:00
然而李没打劫 所以柯一直觉得很奇怪
作者: liaon98 (liaon98)   2016-03-11 16:21:00
那时李也没时间了 在读秒
作者: wen17 (祭祀风的人类)   2016-03-11 16:22:00
昨天是有提到有部分是局部优劣 可以直接"计算"比较
作者: shellpig (贝壳)   2016-03-11 16:22:00
AG下的手法也超出预期呀,不是说用往常下法就一定好
作者: chordate (封侯事在)   2016-03-11 16:22:00
那为什么李会连出缓手让优势就这样溜掉了?
作者: goldduck (哥达鸭)   2016-03-11 16:22:00
型不是重点 问题是型烂你都赢不了啊
作者: wen17 (祭祀风的人类)   2016-03-11 16:23:00
而全局的子后面柯也没说afgo下错 顶多说值得讨论
作者: liaon98 (liaon98)   2016-03-11 16:23:00
ch 大 人类不是机器 犯错不是很正常吗XD 况解比赛压力这么大还要读秒限时
作者: arnold3 (no)   2016-03-11 16:25:00
拓海一开始跟车也只是让人觉得还算会开 哪知道最后甩不掉最重要还是自己被逼到超时压力大被超过去
作者: sck921 (The Fate)   2016-03-11 16:26:00
有人就说电脑算到终盘了阿 XD
作者: chordate (封侯事在)   2016-03-11 16:26:00
感谢回答,所以现在职业棋手的见解是这盘两边都犯错太多,不能算是名留历史的一盘棋吗?
作者: shyangs (厚呦)   2016-03-11 16:28:00
来个二日制,柯可以无限call out各研究室
作者: liaon98 (liaon98)   2016-03-11 16:28:00
第一盘应该历史意义比较大吧
作者: hdjj (hdjj)   2016-03-11 16:28:00
下了一整盘好棋结果紧要关头下出一手臭棋,结果还是会输
作者: shyangs (厚呦)   2016-03-11 16:29:00
这样才能下出接近人类最高水准的棋
作者: aaaba (小强)   2016-03-11 16:30:00
两日制你打卦,隔天就输飞了
作者: notmuchmoney (真的不错....)   2016-03-11 16:32:00
一些话如"捍卫人类尊严"都说出来了 恐怕应该考虑合乎过去棋理的应手
作者: shyangs (厚呦)   2016-03-11 16:32:00
分布式扩大硬件规模,和打卦的时间,意义是一样的
作者: notmuchmoney (真的不错....)   2016-03-11 16:34:00
手机手残按到嘘 抱歉推回
作者: Ebergies (火神)   2016-03-11 16:35:00
往四路压不会让 AG 的中央有更强的势力吗?昨天压五最后右边也还是白子的地吧
作者: darkseer   2016-03-11 16:41:00
我不太懂Monte Carlo搜寻,不过AlphaGo的机率应该不是直觉意义上的机率,比较像是因为无法穷尽变化而做的估计
作者: liaon98 (liaon98)   2016-03-11 16:43:00
白64古力也是说白棋挤在一团没效率 是缓著
楼主: ilw4e (可以吃吗?)   2016-03-11 16:43:00
我知道背后机率没那么简单:D 只是说胜率最高不见得是最佳解而这个游戏是有最佳解的(如果有围棋之神穷举法:D)
作者: AmuroRay (联邦の白き流星)   2016-03-11 16:45:00
这游戏或许有最佳解 但其实过去长久累积的观念所追求的说到底也是胜率最高的解 而未必是最佳解
作者: darkseer   2016-03-11 16:46:00
我班门弄斧了XD 我是猜测他应该是很有效率的逼近逻辑
作者: marrvosal (神清水)   2016-03-11 16:46:00
反了,是我下这手胜率有多高,而非对手下这手胜率多高
作者: darkseer   2016-03-11 16:47:00
只是人知道要局部考虑,AG不知道,所以在局部上AG有弱点
作者: marrvosal (神清水)   2016-03-11 16:47:00
而且实际上蒙地卡罗不会只搜一层random算而是在允许的时间内多算几层,所以唯一解他还是会看到所以电脑会去搜寻下z之后的胜率,会发现这步胜率很高因此电脑会避免让对手下z。
作者: chordate (封侯事在)   2016-03-11 16:56:00
谢谢回答
作者: vvrr (vvrr)   2016-03-11 16:57:00
我不认为它会对必胜必败的点做排除。基本上就是对全局找一个胜率高的解。攻杀不会出错是因为他把后面变化都看过了
作者: shellpig (贝壳)   2016-03-11 17:00:00
能算出来必败的点可以排除吧,现在是算不完所以例如本文中第二段那种案例,阿发狗不会下的
作者: birdy590 (Birdy)   2016-03-11 17:01:00
每个可能的选择会有一个分数, 分数会由该分支往下算所以如果接下来有很大的可能亏损, 分数上自然会被排除有件事大概可以肯定, 就是"AG不会做出亏损太大的选择"
作者: shellpig (贝壳)   2016-03-11 17:02:00
甚至可思考为,在可接受时间内,算出95%的后续变化都能赢
作者: kafai (猪仔包 PigSonBow)   2016-03-11 17:02:00
那算路超深的妙手应该是不一定算得出,小手筋还可以
楼主: ilw4e (可以吃吗?)   2016-03-11 17:03:00
但必须给对方正解的那node特别高的权重电脑才知道不能下吧
作者: birdy590 (Birdy)   2016-03-11 17:03:00
因为 AG 根本只是在计算 它上不知道自己正在下围棋
作者: shellpig (贝壳)   2016-03-11 17:03:00
剩下的绝对不够时间算不完,那就这样子下了
作者: birdy590 (Birdy)   2016-03-11 17:04:00
事实也证明 棋评认为是臭手的 并无法从中获得太多利益
作者: marrvosal (神清水)   2016-03-11 17:05:00
蒙地卡罗有点难讲清楚,但是电脑在这块不太会出错
作者: birdy590 (Birdy)   2016-03-11 17:06:00
第三段的假设是没错 但是好像要在猫脖子上挂铃铛一样想在早期靠"不是很好的着手"取得利益, 本身也很难做到AlphaGo 当然不是无敌, 单机都还是可以击败分布式了
作者: marrvosal (神清水)   2016-03-11 17:08:00
楼上,当然,alphaGo还没有train到最好就算train到最好,也不一定能到围棋之神的实力
作者: birdy590 (Birdy)   2016-03-11 17:11:00
问题是要压过人类 实力不需要到围棋之神啊 @@
作者: marrvosal (神清水)   2016-03-11 17:14:00
是的。
作者: birdy590 (Birdy)   2016-03-11 17:16:00
所以单机和分散对下是不错的指标, 愈靠近 100%, 就知道实力愈强了
作者: marrvosal (神清水)   2016-03-11 17:17:00
实际上alphaGO进步的地方并非单机跟离散离散胜率高只是因为它算得比较快,可以多算一点alphaGO进步的话则是在算之前的候选挑选进步要知道实力有没有变强应该是用新版的跟旧版的比较
作者: birdy590 (Birdy)   2016-03-11 17:20:00
理论上算的愈深愈有机会找到更佳解 新旧只差在训练分布式胜率提高代表运算加深以后正确率有提高
作者: marrvosal (神清水)   2016-03-11 17:23:00
alphaGO的重点就在训练,搜寻多深都只是硬件的问题我甚至认为,当train的越好,单机的胜率会提升
作者: birdy590 (Birdy)   2016-03-11 17:26:00
单机或分散 两边都 train 过一样的东西啊 /_\分散能找到更多确实更好的选择 才是代表训练成功不是吗?
作者: marrvosal (神清水)   2016-03-11 17:27:00
找到好的选择这件是对单机跟分散是一样的差别在于分散从好的选择里面挑出最好的会更好所以如果deep learning 已经好到帮你挑的非常好那你其实不太需要运算量就能选出最好的那步此时就不太需要分散运算
作者: birdy590 (Birdy)   2016-03-11 17:29:00
我觉得在前中段讲这个没啥可能耶 后段则已经是公认的强
作者: Verola (sometimes I love you)   2016-03-11 20:46:00
同marrvosal 觉得单机胜率越高才表示成长 克服了运算速度
作者: RoundKick (我是56我最屌)   2016-03-11 20:49:00
你的解释一日棋迷看的懂才有鬼 有的话楼下帮我吹
作者: NaoGaTsu (那欧卡兹)   2016-03-11 21:42:00
marrvosal的解释完全正确。
作者: Palpatineli (Chancellor)   2016-03-11 22:37:00
我这种只上过AI intro的人都看得出来你讲什么胡话。蒙地卡罗基于的本来就是最大最小树。维基一下最大最小树就完全解答你这篇的外行问题了。
楼主: ilw4e (可以吃吗?)   2016-03-12 00:25:00
哥没上过AI intro,你可以在板上开课,请https://en.wikipedia.org/wiki/Computer_Go这里就有说会有我提的疑问了,加入minimax可以理解,但那是game theory的东西跟monte carlo tree不是直接关系,谢谢总之就是加一个选择最好的最差解的判别来滤掉必败局面
作者: darkseer   2016-03-12 02:40:00
我还是觉得不是,Monte Carlo tree search理论上会收敛到minimax,我猜测这里也是类似的原理:自己和对方的好手在MC tree里头会走得特别深。如果对‘好手’的判断够准就可以避免你说的问题。我也不知道我说的对不对,marrvosal要不要发一篇教学XD

Links booklink

Contact Us: admin [ a t ] ucptt.com