Re: [心得] 这五局对AlphaGo的评价

楼主: wnglon (冷面笑匠)   2016-03-15 21:08:04
※ 引述《shehrevar (阿浩)》之铭言:
: 1. 这五局质感 3>2>4>5>1
: 第三局的象飞,往上跳一手的大局观,第二局的五路尖冲,相信可以给人类带来新思想
: 2. AlphaGo的实力>>小李
: 第四局就不说了,电脑算不到这手整个就烂掉之外,其他四局从头领先到尾
: 李世石完全无任何机会,以最后一局来说好了,AlphaGo官子并不出色
: 我想AlphaGo的"国际礼仪"应该表现得很好,有种不要赢太多的感觉,赢了就好
: 纵使事后研究应该要怎样怎样,对AlphaGo都一样,世界第三实至名归(暂时)
: 3. AlphaGo先交换定型
: 初期来看真的是完全浪费劫财,(之前第二局小目下拖定石刺一个配合5路尖冲完美)
: 右下角的交换在收官的时候却派上用场,这或许之后下也一样,但是对于之后战斗
: 我不觉得有那里损失
: 4. AlphaGo打劫
: 就如众高手说的,能不打则不打,减少变化,但好像真的要下出打劫是多么难的事情
: 平常打劫随处可见,对上AlphaGo就几乎完全消失,值得研究,也呼应第三点
: 既然不打劫,何不赶快定型好,省得日后应手有变
: 5. AlphaGo进化
: 想知道如果拿出最佳胜率点以及最佳目数点的话,可以让人类几目,我猜可以两子
我认为对手是电脑
能抓到算法的破绽就很够了
以电玩来说
玩家打电玩一开始会狂输好几场
但总是有些玩家一开始吃亏
后来抓到魔王AI的BUG
从这BUG衍伸出许多攻击策略
过几天开始就已经打倒魔王
到最后则是挑战无损血K.O.魔王
另外有没有听过打不倒的空气人这首歌?
为何该玩家打不倒空气人
为何专版会有一堆人会说空气人很弱
为何网络上有一堆无损血KO空气人的play
有没有针对电脑AI的BUG作攻击策略
我想是人类战胜AI的重要关键
这种通常要练习几百场 一旦抓到攻击策略
电脑就等著吃鳖
我认为李世石才玩五场就抓到AI之弱点
一旦玩个几百场
阿发狗还用混吗?
看程式设计者赛后心情有点不好
可能是该玩家玩五场就抓到弱点后
如果给其他玩家对奕 会衍伸出一些针对阿发狗的策略
到最后连普通玩家都能干掉阿发狗
那就很不好了
题外话:
有跟星海争霸2的AI打过
一开始打也都是绝望
正面根本不能赢电脑
后来尝试用快攻与偷袭
并观察电脑AI的习性
大约三十几场后 残酷的电脑就变肥料了
我认为要给李世石多玩几场
说不定情况会大不相同
一点浅见
其实我看李输 还蛮难过的
希望人类不会输给电脑AI
作者: wahdee (=.=)   2016-03-15 21:12:00
深蓝也只敢偷袭一次 而且是由人作最后决策 ( ′-`)y-~
作者: scju (QQ)   2016-03-15 21:12:00
照你这样讲,人类会进步,电脑难道就不会自我学习进步吗?
作者: pikachu2421 (皮卡@めぐ民)   2016-03-15 21:12:00
但是AlphaGo还会再改进 进化
作者: scju (QQ)   2016-03-15 21:13:00
几个月后再来,阿尔发GO就更厉害了啊。
作者: Atropos0723 (Atropos)   2016-03-15 21:16:00
这样分析的前提是阿法真有运算架构上的BUG
作者: birdy590 (Birdy)   2016-03-15 21:17:00
李世石的格局显然不只这样而已, 不然 G5 不会自愿拿黑棋
作者: LaPass (LaPass)   2016-03-15 21:18:00
请问,第五局不是本来就是李拿黑吗?我一直搞不清楚自愿拿黑是怎么回事
作者: Atropos0723 (Atropos)   2016-03-15 21:19:00
但是现在的消息来看,是演算资源限制它舍弃机率过小
作者: zelkova (*〞︶〝*)   2016-03-15 21:19:00
无伤过空气人是运气吧 那个龙卷风是随机的
作者: Atropos0723 (Atropos)   2016-03-15 21:20:00
的棋步,换句话说下快棋就是他的罩门
作者: LaPass (LaPass)   2016-03-15 21:20:00
是每次开始都会先猜子,但是第五局李表示想拿黑这样吗?还是照顺序,李应该拿白,但是里要求拿黑?
作者: birdy590 (Birdy)   2016-03-15 21:20:00
按规则第五盘要重新猜先, 但是李世石想拿黑 双方协调OK
作者: LaPass (LaPass)   2016-03-15 21:21:00
原来如此,了解了
作者: birdy590 (Birdy)   2016-03-15 21:22:00
不是在棋盘上真剑胜负, 就没有那种气魄了
作者: aaaba (小强)   2016-03-15 21:22:00
当场猜对李不利啊
作者: shehrevar (阿浩)   2016-03-15 21:22:00
这算抓到弱点吗?google办这比赛的目的就是要找到这bug如果电脑有选到这手,第四局一样GG~当然能让电脑忽略这手小李也是威猛没错
作者: DemonElf (LdsFish)   2016-03-15 21:31:00
原PO提到星海有学习的能力是学玩家的而不是"自我学习"Alphago的演算计往跟以往AI的穷举方式都是有所不同的他是因应围棋算不完那就在有限时间内尽可能算出最大胜率也就是说当然也会有他算不完而输的可能,比方说Google自己就有提到连线的分布式Alphago对单机Alphago胜率约7成
作者: chang505 (眼线)   2016-03-15 21:34:00
你一定不是写程式的,有人帮忙抓到bug有多爽
作者: DemonElf (LdsFish)   2016-03-15 21:34:00
观察起来Google其实很有心测试Alphago的演算能力,除了比赛前就停掉Alphago的学习(也就是这五场都是同一版本)细心一点的人就会发现Alphago并没有特别分配时间再把运算在时间明明还很充裕的情况下再多算一点
作者: jpg31415926 (圆周率π)   2016-03-15 21:38:00
Google花了钱当然希望有成效阿 赢了出名 输了抓虫怎样都不亏阿
作者: DemonElf (LdsFish)   2016-03-15 21:38:00
Google应该是为了确认算法的极限所以还自主设了一些运算时间(/次数?)限制
作者: DemonElf (LdsFish)   2016-03-15 21:40:00
真的,这次大赛对双方来说都是很宝贵的收获建议原PO去Google一下"深度学习"的文章多了解一下Alphago很有价值的一点就是他能"自我对奕"也所以他能一定程试自主修正原本的水准
作者: LaPass (LaPass)   2016-03-15 21:45:00
楼上,答案是不一定。
作者: DemonElf (LdsFish)   2016-03-15 21:46:00
Alphago从去年约六段职业棋手的实力提升到现在能赢九段就是突显深度学习的价值
作者: LaPass (LaPass)   2016-03-15 21:47:00
有些先天的决策问题是要去修程式码才能解决的,例如不是走最佳棋步,而是走胜率最高的棋步之类的。这会导致中盘赢
作者: DemonElf (LdsFish)   2016-03-15 21:48:00
我说明的并不是Alphago是完美的啊,完美的话就不会输了
作者: LaPass (LaPass)   2016-03-15 21:49:00
50目,最后只赢2.5目这种状况。这主要是蒙地卡罗看的是胜率,而不是赢棋数的原因。也就是说对狗狗而言,赢0.5目跟赢55.5目是一样的。所以在大优势的状况下会一直送,因为他觉得胜率差不多。
作者: DemonElf (LdsFish)   2016-03-15 21:50:00
要我来说的话,这不叫BUG,而是数学,这结果代表以胜率
作者: LaPass (LaPass)   2016-03-15 21:51:00
然后,输太多的话,像第四局,会想要一口气赢二十几目回来
作者: DemonElf (LdsFish)   2016-03-15 21:51:00
为优先的算法还是很有调整空间
作者: LaPass (LaPass)   2016-03-15 21:52:00
,而不是跟人类一样,一点一点的追回来,等对方失误时在超越
作者: DemonElf (LdsFish)   2016-03-15 21:52:00
在看这几局总觉得很多人会把下好下坏都看得太偏
作者: DemonElf (LdsFish)   2016-03-15 21:53:00
回归到人跟人下棋时,之所以有输赢不也是因为好手与失误的统合结果,但是放到人机对战就好像失误就都不正常了只要围棋还是"算不完",那么永远就只会有较佳而不是完美解,而且也有新闻提到开始有高段棋手试着采用Alphago的的胜率流概念、而且还下赢了,这代表的是这样的演算技术不仅是展现了科学上的价值,也可以帮他所涉及领域突破原本的经验框架再求精进
作者: birdy590 (Birdy)   2016-03-15 22:01:00
G4 那一连串异常只能视为 bug... 一步没算到不是问题但是接下来连续几步继续送棋. 是不应该发生的(完全不用估值网络的 Darkforest, 在这里是没有问题的)电脑也不会"想要一口气赢二十几目" 因为它根本不会"想"
作者: LaPass (LaPass)   2016-03-15 22:05:00
好吧,那改成他计算要追上20目的方法
作者: shehrevar (阿浩)   2016-03-15 22:07:00
配合AlphaGo选点,官子给人收的话,赢10目以上没问题
作者: birdy590 (Birdy)   2016-03-15 22:08:00
它养的小小兵棋力本来就不强啊, 估值网络看起来是有效但还不够稳定... 官子的异状跟这个很可能也有关系有很多参数可以调整, 所以这次和一流高手的实战极为宝贵
作者: goldduck (哥达鸭)   2016-03-15 22:14:00
配合狗狗选点 给人下跟收官 20目也不难
作者: birdy590 (Birdy)   2016-03-15 22:20:00
的确是如此 下到一半交给其它人类九段关门 应该是稳赢的所以目前人类的确还是有比它强的地方 聂卫平的观察蛮准要在中盘压过它得表现完全才有可能, 一点错误都不能犯表现完"美"
作者: imperfectJJT ( )   2016-03-15 22:37:00
会只走同样套路就不是顶尖工程师们打算构筑出的AI
作者: yamiyodare (shantotto)   2016-03-15 22:37:00
官子是算目的世界, AlphaGo 还在算胜率下起来自然怪.还有一个可能是胜率 100% 的路太多, 但不知哪个赢得多看起来就不会是最佳手顺, 而是随便选一条走.AlphaGo 可能要稍微落后, 才看得出收官的实力.
作者: imperfectJJT ( )   2016-03-15 22:40:00
阿Go若改版成在N手后开始算局部的权重加重应该更猛?
作者: Ebergies (火神)   2016-03-15 22:44:00
胜率 100% 的路太多 <= 这个蛮有可能的
作者: imperfectJJT ( )   2016-03-15 23:08:00
我觉得当人类必须开始去理解AI的思路并且从AI学习进步 新的纪元就已经开始了 而且学完后AI还是没输你
作者: mothertime (我超爱傅红雪这变态)   2016-03-15 23:13:00
第五局原订猜先,是李在第四局后要求执黑挑战
作者: imperfectJJT ( )   2016-03-15 23:17:00
觉得官子收不好 可能是因阿Go虽然损 但觉得后续对手能使对胜率的变化较少才那样走 代表着白其实赢更多
作者: birdy590 (Birdy)   2016-03-15 23:22:00
现在这个算法 实质上靠的还是暴力运算 所谓的学习能力只是增强计算效率的辅助措施罢了, 学习可以做出"棋感"但是做不出计算能力...
作者: DemonElf (LdsFish)   2016-03-15 23:42:00
有一篇是Facebook研究员解析Alphago的文章可以看看http://goo.gl/gIikTa
作者: bbbtri (cycling)   2016-03-15 23:45:00
楼上那个连结已经出现过好多次啦
作者: DemonElf (LdsFish)   2016-03-15 23:46:00
但显然还是有很多人没看过啊(比方说原PO)XDfacebook这篇文章有一个重点就是调整不同的演算比重是会影响下出来的品质或胜率,也就是越了解就越可以了解AI也是在有限运算下尽可能寻求胜利但还是有其极限的最佳化统合成果,只要电脑技术还是没有能力完全算完围棋,理论上就不会有完美解但他若能赢下多数棋局,这就是棋力的展现了,不是吗?
作者: steve1012 (steve)   2016-03-16 01:08:00
我也觉得很多人没看懂那篇文章
作者: MicroB ( )   2016-03-16 03:18:00
用个简单比喻 电脑靠速算的三段网络胜率做了一个数值解的fit 人用各式各用不精确地棋理近似 做了一个理论解 你理论解要更优 棋理的精细度得提升 就可以赢了
作者: lolylolyosu (3-1次元)   2016-03-16 08:30:00
因为我在第二场结束后 就对黄士伟提出了阿发狗的弱点啦 其实阿发狗弱在"一分钟的情况下" 征子和收官电脑反而强在前.中期 因为布局可以避开征子 大概是这个理由

Links booklink

Contact Us: admin [ a t ] ucptt.com