楼主:
Vonix (台湾大赌场欢迎您)
2016-03-14 13:19:53我尝试用一句话来讲ALphaGo的弱点
昨天AlphaGo第一次暴露出弱点,不知道是不是李世石有意为之?
李世石在左右方都避开了战斗,却在大局不利时才在中央掀起战斗,
从盘后解析可以看出,白78神手挽回了局面,但若黑棋应对得宜,
局面其实还是细微;但却造成电脑崩溃自爆。
从机器的角度来理解,中腹战斗比边角更复杂难算,且昨天的例子有
可能形成大劫争(但打下去黑棋整体也没有不利),电脑在这种CASE
爆掉,不知道第五盘李世石会不会再度制造这种局面?
你说的没错 可是小李居然说弱点是阿发够执黑有可能会爆之类的 这最好是有关系XD 他该不会故意不讲出来弱点吧
他下完二十分钟就记者会了,要这样黑李九段太过了吧@@
从算法角度来看...可能劫争复杂度更高 他算不清楚胜率如果只是直接打劫可能胜率还算的清楚 但是是很多复杂变化中还有打劫的变化图的话 可能他胜率就难以正确估算
http://www.thenewslens.com/post/297239/ 我没有要黑小李 我只是想黑这篇报导而已XDD原PO你意思是官子中如果也有劫争电脑也会算不清吗?感觉也有可能耶 因为官子通常觉得电脑应该要很强...但如果也有劫争说不定又要爆了
神手也不是说下就下得出来,小李78手可以发挥的形势,至少在左方白块被强压黑造就明显外势时还看不出来,要说是刻意为之(蓄意造成78手的情形),小李除非有完成穷举的实力(也就是围棋上帝),否则根本不可能办得到。
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:01:00今天的局面可能小李无心造成 但是如果有心引导 有机会因为一场打赢 其实大家也勾勒出AlphaGO的外型了就像古力快变成古力狗一样 小李应该大多摸清了狗狗个性
有心引导是一回事,但AlphaGo也不是纸扎的,也要真的能次次应手都如李估计才行,这不穷举达到围棋上帝的境界根本不可能。古力昨天也不是次次猜次次中啊。更别说昨天AG大自爆时,并不是判定劫争应手不利,而是错
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:05:00目前可以利用的就 狗狗最爱避劫 爱及早定型 爱抢先手
再推,我现在对于AlphaGo缺点的看法就是Vonix派XD是不是可以说要制造这种局面,然后之后如果都做出很好的应对(像是白78,以及不犯错)就有机会坐等自爆‘制造局面让电脑估错,乘机争取上风让电脑自爆’之类?因为让电脑算错 及 让电脑自爆 不必然等同
若是依这个逻辑,可能的胜点就只有“前盘保守避战,还得在盘面制造己身大量弱棋区(昨天有三块弱棋),然后在中腹
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:14:00耶~Nao大你说的不正是李世石拿手好戏吗?XD
李世石的拿手好戏是当对手是人时才有办法刻意经营的,现在的对手是“目前看来”不可能被对手刻意引导的AG耶对手是人时,有棋风、前中盘势弱区(和逻辑上弱区)的限制,要利用对手的弱点、下棋的惯性去引导还比较容易,要刻意在AG面前造就那样的局面,若真可以的话,前三盘就不会输得这么彻底。
作者:
Uizmp (黑袍法师)
2016-03-14 14:18:00也不一定, 前三盘还没有测出AG在什么情况下有可能爆掉
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:21:00而且今天四盘下来惯性也大概确定了 甚至爆掉后 习惯一样没改 包括爱走掉先手 虽然会劫争 但是先避再说 还有老是爱自损定型
所以我才说如果之后让柯杰对战阿发够不公平 等于小李都帮他试出阿发够的弱点了 然后给柯洁收成 若是弱点真的这
作者:
zeat (L.)
2016-03-14 14:27:00可是前三盘时的小李对alphago完全不了解,前三盘也算是缴了学费吧
样 给柯洁来下或者小李自己重新下5盘我觉得都是5:0或4:1
作者:
zeat (L.)
2016-03-14 14:28:00之后柯洁面对的说不定是betago了XD
怕就是怕都有小李给了五局经验了,柯洁还是被0:5完结若是如此,就代表阿发狗的bug只有在极端条件下才会被触
作者:
wnglon (冷面笑匠)
2016-03-14 14:29:00先低调 明天很难说 第三盘的确有劫争
发。(光是自我对战3000万局都没发现有这bug,就够离奇)
等等 你怎么知道3000万局没有bug?难道开发者有时间一局
作者:
wnglon (冷面笑匠)
2016-03-14 14:30:00李的确只赢一盘 只是电脑爆掉的下法
作者:
wnglon (冷面笑匠)
2016-03-14 14:31:00连小学生都不如 这才是我失望的所在
类来刻意引出这种变化就不一样了 毕竟中盘高空战要出现
所以你觉得开发者有一局局看完?3000万局?那我真的只能给
推NaoGaTsu,工程师可以写出很多‘坏棋侦测器’
,设计一台人工智能下棋机,却没有任何验证程式去确保算法无误?也太小看google的技术力了吧 = =
除非阿发够爆掉都一定会爆到像昨天那种初学者程度 但如
我在想,AG自爆后一样按MCTS运算接下来的胜率落点,但对
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:34:00如果有坏棋侦测器 那我装在AlphaGO身上就好 今天也不会
对阿 如果今天真有这坏棋侦测器 为啥不用来过滤阿发够下的棋?还是棋时开发者也对这坏棋侦测器没有信心?
说白了就是你让阿发狗跑3000万个数据群集出来却没有任何工具可以分析大数据的正确性,这也太把以搜寻引擎起家的大数据公司“始祖”看太扁了。
作者:
Uizmp (黑袍法师)
2016-03-14 14:36:00AG的团队中,不是只有aja比较懂围棋吗?人也没有办法每盘都看
言而总之,aja他们肯定有办法找出误区,否则阿发狗也不
就我看来它们顶多从3000万局中取出些样本出来 然后请樊
作者:
Uizmp (黑袍法师)
2016-03-14 14:37:00要用一些条件把这种所谓的bug滤出来, 或者叫AG回报
= = 有技术开发人工智能的公司还得用人力验证是哪招啦
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:37:00AlphaGO是用图形侦测 怕是到87手才发现整个图很糟糕
是啊,AG到87手才找出误区,但为时已晚,没屁用啊。
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:38:00AlphaGO的大局观就是图形侦测来的 但是也因此失误
AG只是发现胜率骤降 胜率骤降一定是因为他自己突然下坏棋?所有胜率骤降都是有小学生棋步出现?
目前看来最有可能的,就是AG一到大劣势区就运作失能了
AlphaGo可以说用图形侦测吗? 我理解那个只是类比@@
你问的问题只有等aja他们分析完资料才知道是不是了。因为我们目前知道AG发生胜率骤降的案例只有这一次。
你确定那3000万局没有?好 退一万步说 就算它们真的有写坏棋侦测器 而真的可以准确侦测坏棋 但是那3000万局也是
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:41:00因为AlphaGO在爆掉之后 还去逃右边死棋 想围起来
阿发够自己在下 目前看来他很可能就是自己回避劫争 等于
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:42:00所以我才怀疑 狗狗应该是用图去感觉 造成大局观
作者:
Uizmp (黑袍法师)
2016-03-14 14:43:00问题就在于今天这个种东西要怎么回报, 回报后要怎么修正
争 并不是一定要下出劫争 而是大型攻杀中有打劫的变化我个人对于这个bug要修正不怎么乐观 因为这不是告诉阿发
够说你打劫的时候要多小心就好了 可能是要给他一个全新
辑出问题,阿发狗自己也无力修正啊。(例如是ValueNetwork给的权重错误或估算逻辑上编程错误)
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:44:00AlphaGO自我对奕 很多奇怪的bug反而会被隐藏起来
作者:
Uizmp (黑袍法师)
2016-03-14 14:44:00目前来看,AG是有办法回报79手下错,但是并没有回报那些臭棋
所以嘛,就不是有没有自我侦测误区的功能的问题,而是阿
To moonlind & profyang,装了也有不稳的风险,要测试的话,可以容许坏棋侦测器误判,实战不行。说不定测试时就都没问题,所以就不装啦。
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:45:00假设两个笨蛋对奕 越对越聪明的可能性是?
也不是说一定想不出来新算法 但肯定不是稍微修改一下
所以一开始的AG会变成只知道围棋规则的30K棋士。
作者:
Uizmp (黑袍法师)
2016-03-14 14:46:00另外就是为什么87步时就发现错误之后还可以下出97这种棋
对阿 总之也许你们说的对 有装坏棋侦测器 但这侦测器准
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:48:00因为图形类比吧 成就了阿法狗的大局观 但是...
不准我就很质疑了而且就算准 阿发够他自己的棋风也很可能导致他自己下时
作者:
moonlind (又多了敷脸卡跟觅食卡了~)
2016-03-14 14:49:00例如101手 可能有胜率 前提是李世石不鸟他 但人类怎可能不鸟他 人又不是笨蛋
另一个重点就是这个坏棋侦测棋到底要base on什么原则去判定?人类对好坏棋的原则?可是我怎么记得几天前人类觉得的坏棋五路尖冲还被大大的称赞?那坏棋侦测器应该要侦测出这种棋吗?总之好坏棋的判定要化成程式码我觉得很难 几乎等于是写出半个阿发够了
profyang你说的有道理,确实可能知道有问题但是修不了只是我从资讯产业的观点,觉得如果知道不会那么早约战..像101这种坏棋,我觉得写个判定棋还是可以的不用很准,Aja或其他人可以从千万盘抓出几十盘来人工读
而且棋时101要说是坏棋 是因为我们觉得他明明死了你还下但说实在的这部棋有损很多目吗?就官子来看顶多5~6目之类真的笋比较多的我觉得反而是像93这种 外面还被94提掉 还有97也是 更损 但是这种要判定就不像101这么好判定了何况以上这些"坏棋"如果今天刚好双方正在打劫 那就叫做找劫材而未必是坏棋了 这时又开怎么判断 写个打劫条件判断式?可是有时候打劫也未必就一直在打 有时候打一打还会摆着 这时到底算不算"打劫中"?
为了打劫而下101不会对方刚提过劫才可能吗? 我可能不懂不过确实同意是有不少难处我没想清楚@@
一般找劫材确实要刚提过劫材可以 但是像刚才讲的97这种正常之下非常损的棋 但是如果有要打很大的劫 有时可能会先来下97 这时不是单纯的找劫材 而是制造劫材 因为97下了白棋如实战正常的下了之后 会产生更大的劫材btw可是这场阿发够确实在自己把打劫的变化削除了之后(91才跑去97制造劫材 所以97才是坏棋
作者:
wnglon (冷面笑匠)
2016-03-14 15:26:00有人说的很对 为何电脑会下101这种棋难道自我练习的三千盘从为出现过?我觉得ag劫争的逻辑有问题而且电脑不会有情绪问题 是不可能下错棋而自爆
作者:
tsai18 (......)
2016-03-14 15:33:00Alphago会不会面对业余棋手更容易输阿....
作者:
wnglon (冷面笑匠)
2016-03-14 15:35:00有人说ag有学习能力 很多盘面都下过了
作者:
Uizmp (黑袍法师)
2016-03-14 15:35:00不晓得以现在的AG,打劫甚至连环劫分支在评价系统中怎么评估
作者:
wnglon (冷面笑匠)
2016-03-14 15:36:00但会犯这种错误颇无言 所以才推论ag无学习能力 而是用算法走棋
作者:
Uizmp (黑袍法师)
2016-03-14 15:38:00看定义, 以自适应的方式调整算法(落子法)叫不叫"学习"
作者:
birdy590 (Birdy)
2016-03-14 15:43:00有点想来整理一下 因为现在看来还是很多人没搞懂
作者:
MicroB ( )
2016-03-14 15:44:00而且他的学习也不是看过就会 要数量够大到影响胜率才会改
作者:
birdy590 (Birdy)
2016-03-14 15:46:00请先看一下 7779
看ELO就知道了,业余来下就是被alphaGO稳稳胜
想太多...业余棋手根本很难在阿发够面前造成这种局面
我觉得大家想太多,只要盘面太小无争胜之处就会乱下了下哪都会输,所以要缴棋赌对方出错,都应对都投子了只是前3盘领先落后不多才没看到,我猜自我对亦时师的alphago尾巴就会这样下
所以李九段前期避战是为了制造这样的局面吗0.0?神78手 好像想了超过15分钟的样子??
profyang你有没有什么看法XD? 看了第五局白48开始,我开始觉得你终究是对的,Deepmind可能没有测试得很彻底+ AlphaGo本身棋风可能找不出这类bug重新用科学家而不是棋迷的角度想,突然觉得更能理解XD现在觉得Deepmind团队就只是真的想来切磋学习@@