[讨论] 电脑弱点：中腹有打劫可能的复杂生死战？ Vonix PTT批踢踢实业坊

[讨论] 电脑弱点：中腹有打劫可能的复杂生死战？

楼主: Vonix (台湾大赌场欢迎您) 2016-03-14 13:19:53

我尝试用一句话来讲ALphaGo的弱点
昨天AlphaGo第一次暴露出弱点，不知道是不是李世石有意为之？
李世石在左右方都避开了战斗，却在大局不利时才在中央掀起战斗，
从盘后解析可以看出，白78神手挽回了局面，但若黑棋应对得宜，
局面其实还是细微；但却造成电脑崩溃自爆。
从机器的角度来理解，中腹战斗比边角更复杂难算，且昨天的例子有
可能形成大劫争（但打下去黑棋整体也没有不利），电脑在这种CASE
爆掉，不知道第五盘李世石会不会再度制造这种局面？

作者: aegis43210 (宇宙) 2016-03-14 13:22:00

以小李这等级的棋手，要再度制造这局面并不是不可能

作者: darkseer 2016-03-14 13:24:00

推，另外请问是以算法观点来做出这个推论吗?

作者: profyang (prof) 2016-03-14 13:24:00

你说的没错可是小李居然说弱点是阿发够执黑有可能会爆之类的这最好是有关系XD 他该不会故意不讲出来弱点吧

作者: darkseer 2016-03-14 13:25:00

他下完二十分钟就记者会了，要这样黑李九段太过了吧@@

作者: profyang (prof) 2016-03-14 13:26:00

从算法角度来看...可能劫争复杂度更高他算不清楚胜率如果只是直接打劫可能胜率还算的清楚但是是很多复杂变化中还有打劫的变化图的话可能他胜率就难以正确估算http://www.thenewslens.com/post/297239/ 我没有要黑小李我只是想黑这篇报导而已XDD原PO你意思是官子中如果也有劫争电脑也会算不清吗?感觉也有可能耶因为官子通常觉得电脑应该要很强...但如果也有劫争说不定又要爆了

作者: NaoGaTsu (那欧卡兹) 2016-03-14 13:58:00

神手也不是说下就下得出来，小李78手可以发挥的形势，至少在左方白块被强压黑造就明显外势时还看不出来，要说是刻意为之(蓄意造成78手的情形)，小李除非有完成穷举的实力(也就是围棋上帝)，否则根本不可能办得到。

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:01:00

今天的局面可能小李无心造成但是如果有心引导有机会因为一场打赢其实大家也勾勒出AlphaGO的外型了就像古力快变成古力狗一样小李应该大多摸清了狗狗个性

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:03:00

有心引导是一回事，但AlphaGo也不是纸扎的，也要真的能次次应手都如李估计才行，这不穷举达到围棋上帝的境界根本不可能。古力昨天也不是次次猜次次中啊。更别说昨天AG大自爆时，并不是判定劫争应手不利，而是错

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:05:00

目前可以利用的就狗狗最爱避劫爱及早定型爱抢先手

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:05:00

估79应手的胜率。

作者: darkseer 2016-03-14 14:06:00

再推，我现在对于AlphaGo缺点的看法就是Vonix派XD是不是可以说要制造这种局面，然后之后如果都做出很好的应对(像是白78，以及不犯错)就有机会坐等自爆‘制造局面让电脑估错，乘机争取上风让电脑自爆’之类?因为让电脑算错及让电脑自爆不必然等同

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:10:00

若是依这个逻辑，可能的胜点就只有“前盘保守避战，还得在盘面制造己身大量弱棋区(昨天有三块弱棋)，然后在中腹

作者: blacktom (泉) 2016-03-14 14:10:00

应对得宜应该是白完全不行

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:14:00

耶~Nao大你说的不正是李世石拿手好戏吗?XD

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:14:00

李世石的拿手好戏是当对手是人时才有办法刻意经营的，现在的对手是“目前看来”不可能被对手刻意引导的AG耶对手是人时，有棋风、前中盘势弱区(和逻辑上弱区)的限制，要利用对手的弱点、下棋的惯性去引导还比较容易，要刻意在AG面前造就那样的局面，若真可以的话，前三盘就不会输得这么彻底。

作者: Uizmp (黑袍法师) 2016-03-14 14:18:00

也不一定, 前三盘还没有测出AG在什么情况下有可能爆掉

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:21:00

而且今天四盘下来惯性也大概确定了甚至爆掉后习惯一样没改包括爱走掉先手虽然会劫争但是先避再说还有老是爱自损定型

作者: profyang (prof) 2016-03-14 14:26:00

所以我才说如果之后让柯杰对战阿发够不公平等于小李都帮他试出阿发够的弱点了然后给柯洁收成若是弱点真的这

作者: zeat (L.) 2016-03-14 14:27:00

可是前三盘时的小李对alphago完全不了解，前三盘也算是缴了学费吧

作者: profyang (prof) 2016-03-14 14:27:00

样给柯洁来下或者小李自己重新下5盘我觉得都是5:0或4:1

作者: zeat (L.) 2016-03-14 14:28:00

之后柯洁面对的说不定是betago了XD

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:28:00

怕就是怕都有小李给了五局经验了，柯洁还是被0:5完结若是如此，就代表阿发狗的bug只有在极端条件下才会被触

作者: wnglon (冷面笑匠) 2016-03-14 14:29:00

先低调明天很难说第三盘的确有劫争

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:29:00

发。(光是自我对战3000万局都没发现有这bug，就够离奇)

作者: darkseer 2016-03-14 14:30:00

(应该说没有以容易纪录的方式触发这个bug?)

作者: profyang (prof) 2016-03-14 14:30:00

等等你怎么知道3000万局没有bug?难道开发者有时间一局

作者: wnglon (冷面笑匠) 2016-03-14 14:30:00

李的确只赢一盘只是电脑爆掉的下法

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:31:00

工程师们也不是领干薪的好吗…

作者: wnglon (冷面笑匠) 2016-03-14 14:31:00

连小学生都不如这才是我失望的所在

作者: profyang (prof) 2016-03-14 14:31:00

类来刻意引出这种变化就不一样了毕竟中盘高空战要出现

作者: profyang (prof) 2016-03-14 14:32:00

所以你觉得开发者有一局局看完?3000万局?那我真的只能给

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:32:00

我觉得连小学生都不如这点，才是真的有趣的地方。

作者: darkseer 2016-03-14 14:32:00

推NaoGaTsu，工程师可以写出很多‘坏棋侦测器’

作者: profyang (prof) 2016-03-14 14:33:00

坏棋有那么好侦测我还研发阿发够干嘛

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:33:00

，设计一台人工智能下棋机，却没有任何验证程式去确保算法无误？也太小看google的技术力了吧 = =

作者: darkseer 2016-03-14 14:33:00

不不，是存下棋谱之后侦测单步有没有违反基本原则

作者: profyang (prof) 2016-03-14 14:34:00

除非阿发够爆掉都一定会爆到像昨天那种初学者程度但如

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:34:00

我在想，AG自爆后一样按MCTS运算接下来的胜率落点，但对

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:34:00

如果有坏棋侦测器那我装在AlphaGO身上就好今天也不会

作者: darkseer 2016-03-14 14:34:00

譬如101手，应该不会很难侦测吧XD

作者: profyang (prof) 2016-03-14 14:35:00

对阿如果今天真有这坏棋侦测器为啥不用来过滤阿发够下的棋?还是棋时开发者也对这坏棋侦测器没有信心?

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:35:00

说白了就是你让阿发狗跑3000万个数据群集出来却没有任何工具可以分析大数据的正确性，这也太把以搜寻引擎起家的大数据公司“始祖”看太扁了。

作者: Uizmp (黑袍法师) 2016-03-14 14:36:00

AG的团队中,不是只有aja比较懂围棋吗?人也没有办法每盘都看

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:36:00

言而总之，aja他们肯定有办法找出误区，否则阿发狗也不

作者: profyang (prof) 2016-03-14 14:36:00

就我看来它们顶多从3000万局中取出些样本出来然后请樊

作者: Uizmp (黑袍法师) 2016-03-14 14:37:00

要用一些条件把这种所谓的bug滤出来, 或者叫AG回报

作者: profyang (prof) 2016-03-14 14:37:00

麾之类的人去看有没有明显的坏棋

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:37:00

= = 有技术开发人工智能的公司还得用人力验证是哪招啦

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:37:00

AlphaGO是用图形侦测怕是到87手才发现整个图很糟糕

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:38:00

是啊，AG到87手才找出误区，但为时已晚，没屁用啊。

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:38:00

AlphaGO的大局观就是图形侦测来的但是也因此失误

作者: profyang (prof) 2016-03-14 14:39:00

AG只是发现胜率骤降胜率骤降一定是因为他自己突然下坏棋?所有胜率骤降都是有小学生棋步出现?

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:39:00

目前看来最有可能的，就是AG一到大劣势区就运作失能了

作者: darkseer 2016-03-14 14:39:00

AlphaGo可以说用图形侦测吗? 我理解那个只是类比@@

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:40:00

你问的问题只有等aja他们分析完资料才知道是不是了。因为我们目前知道AG发生胜率骤降的案例只有这一次。

作者: profyang (prof) 2016-03-14 14:41:00

你确定那3000万局没有?好退一万步说就算它们真的有写坏棋侦测器而真的可以准确侦测坏棋但是那3000万局也是

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:41:00

因为AlphaGO在爆掉之后还去逃右边死棋想围起来

作者: profyang (prof) 2016-03-14 14:42:00

阿发够自己在下目前看来他很可能就是自己回避劫争等于

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:42:00

所以我才怀疑狗狗应该是用图去感觉造成大局观

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:43:00

我不确定啊，我又不是DM的人。你能确定有？

作者: Uizmp (黑袍法师) 2016-03-14 14:43:00

问题就在于今天这个种东西要怎么回报, 回报后要怎么修正

作者: profyang (prof) 2016-03-14 14:43:00

争并不是一定要下出劫争而是大型攻杀中有打劫的变化我个人对于这个bug要修正不怎么乐观因为这不是告诉阿发

作者: profyang (prof) 2016-03-14 14:44:00

够说你打劫的时候要多小心就好了可能是要给他一个全新

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:44:00

辑出问题，阿发狗自己也无力修正啊。(例如是ValueNetwork给的权重错误或估算逻辑上编程错误)

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:44:00

AlphaGO自我对奕很多奇怪的bug反而会被隐藏起来

作者: Uizmp (黑袍法师) 2016-03-14 14:44:00

目前来看,AG是有办法回报79手下错,但是并没有回报那些臭棋

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:45:00

所以嘛，就不是有没有自我侦测误区的功能的问题，而是阿

作者: darkseer 2016-03-14 14:45:00

To moonlind & profyang，装了也有不稳的风险，要测试的话，可以容许坏棋侦测器误判，实战不行。说不定测试时就都没问题，所以就不装啦。

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:45:00

假设两个笨蛋对奕越对越聪明的可能性是?

作者: profyang (prof) 2016-03-14 14:46:00

也不是说一定想不出来新算法但肯定不是稍微修改一下

作者: NaoGaTsu (那欧卡兹) 2016-03-14 14:46:00

所以一开始的AG会变成只知道围棋规则的30K棋士。

作者: Uizmp (黑袍法师) 2016-03-14 14:46:00

另外就是为什么87步时就发现错误之后还可以下出97这种棋

作者: profyang (prof) 2016-03-14 14:47:00

对阿总之也许你们说的对有装坏棋侦测器但这侦测器准

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:48:00

因为图形类比吧成就了阿法狗的大局观但是...

作者: profyang (prof) 2016-03-14 14:48:00

不准我就很质疑了而且就算准阿发够他自己的棋风也很可能导致他自己下时

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-14 14:49:00

例如101手可能有胜率前提是李世石不鸟他但人类怎可能不鸟他人又不是笨蛋

作者: profyang (prof) 2016-03-14 14:52:00

另一个重点就是这个坏棋侦测棋到底要base on什么原则去判定?人类对好坏棋的原则?可是我怎么记得几天前人类觉得的坏棋五路尖冲还被大大的称赞?那坏棋侦测器应该要侦测出这种棋吗?总之好坏棋的判定要化成程式码我觉得很难几乎等于是写出半个阿发够了

作者: darkseer 2016-03-14 14:56:00

profyang你说的有道理，确实可能知道有问题但是修不了只是我从资讯产业的观点，觉得如果知道不会那么早约战..像101这种坏棋，我觉得写个判定棋还是可以的不用很准，Aja或其他人可以从千万盘抓出几十盘来人工读

作者: profyang (prof) 2016-03-14 15:00:00

而且棋时101要说是坏棋是因为我们觉得他明明死了你还下但说实在的这部棋有损很多目吗?就官子来看顶多5~6目之类真的笋比较多的我觉得反而是像93这种外面还被94提掉还有97也是更损但是这种要判定就不像101这么好判定了何况以上这些"坏棋"如果今天刚好双方正在打劫那就叫做找劫材而未必是坏棋了这时又开怎么判断写个打劫条件判断式?可是有时候打劫也未必就一直在打有时候打一打还会摆着这时到底算不算"打劫中"?

作者: darkseer 2016-03-14 15:05:00

为了打劫而下101不会对方刚提过劫才可能吗? 我可能不懂不过确实同意是有不少难处我没想清楚@@

作者: profyang (prof) 2016-03-14 15:09:00

一般找劫材确实要刚提过劫材可以但是像刚才讲的97这种正常之下非常损的棋但是如果有要打很大的劫有时可能会先来下97 这时不是单纯的找劫材而是制造劫材因为97下了白棋如实战正常的下了之后会产生更大的劫材btw可是这场阿发够确实在自己把打劫的变化削除了之后(91才跑去97制造劫材所以97才是坏棋

作者: wnglon (冷面笑匠) 2016-03-14 15:26:00

有人说的很对为何电脑会下101这种棋难道自我练习的三千盘从为出现过?我觉得ag劫争的逻辑有问题而且电脑不会有情绪问题是不可能下错棋而自爆

作者: tsai18 (......) 2016-03-14 15:33:00

Alphago会不会面对业余棋手更容易输阿....

作者: wnglon (冷面笑匠) 2016-03-14 15:35:00

有人说ag有学习能力很多盘面都下过了

作者: Uizmp (黑袍法师) 2016-03-14 15:35:00

不晓得以现在的AG,打劫甚至连环劫分支在评价系统中怎么评估

作者: wnglon (冷面笑匠) 2016-03-14 15:36:00

但会犯这种错误颇无言所以才推论ag无学习能力而是用算法走棋

作者: Uizmp (黑袍法师) 2016-03-14 15:38:00

看定义, 以自适应的方式调整算法(落子法)叫不叫"学习"

作者: birdy590 (Birdy) 2016-03-14 15:43:00

有点想来整理一下因为现在看来还是很多人没搞懂

作者: MicroB ( ) 2016-03-14 15:44:00

而且他的学习也不是看过就会要数量够大到影响胜率才会改

作者: birdy590 (Birdy) 2016-03-14 15:46:00

请先看一下 7779

作者: aegis43210 (宇宙) 2016-03-14 15:46:00

看ELO就知道了，业余来下就是被alphaGO稳稳胜

作者: profyang (prof) 2016-03-14 15:48:00

想太多...业余棋手根本很难在阿发够面前造成这种局面

作者: ykes60513 (いちご) 2016-03-14 16:23:00

业余就能简单找出Bug 那叫黄士杰自己来就行了

作者: broodworld (john) 2016-03-14 16:30:00

我觉得大家想太多,只要盘面太小无争胜之处就会乱下了下哪都会输,所以要缴棋赌对方出错,都应对都投子了只是前3盘领先落后不多才没看到,我猜自我对亦时师的alphago尾巴就会这样下

作者: gold97972000 (Miyanaga Saki) 2016-03-14 16:33:00

所以李九段前期避战是为了制造这样的局面吗0.0?神78手好像想了超过15分钟的样子??

作者: darkseer 2016-03-15 14:42:00

profyang你有没有什么看法XD? 看了第五局白48开始，我开始觉得你终究是对的，Deepmind可能没有测试得很彻底+ AlphaGo本身棋风可能找不出这类bug重新用科学家而不是棋迷的角度想，突然觉得更能理解XD现在觉得Deepmind团队就只是真的想来切磋学习@@

继续阅读

Re: [心得] 围棋AI AlphaGo 之我见kafai [问题] 职业棋手一生的对弈／训练量？upu Re: [心得] 古今世界围棋高手的比较 / 围棋基本理解Rueyh [棋讯] Alpha Go 来 ELO 参一脚了helloallen29 [转录] “战胜自己”对于AlphaGo而言不只是口号Tkuei [心得] 电脑和围棋高手对弈可以取胜不足为怪willrise Re: [讨论] 人机对战的热潮后，要如何推广围棋呢?librevie Re: [影片] 张东岳解说李世石获胜第四盘mathbug [心得] 古今世界围棋高手的比较 / 围棋基本理解emptyfree [新闻] 李世石胜利至少5层内涵围棋将迎黄金时代?zkow