Re: [情报] Alphago新的自战对局

楼主: ilw4e (可以吃吗?)   2017-05-27 23:07:55
※ 引述《HeterCompute (异质运算)》之铭言:
: https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
: AlphaGo说每天都会更新10盘新的自我对战。
: PS:一开始点进去第一盘好像会有bug不能按,
: 要看的话请自己点一下其它盘再点回来第一盘。
: PS2:10盘有8盘黑棋爆炸,看来贴目7.5太多了XD
看野狐职棋讲前三盘,大致就是一直说看不懂:D
如果说真要从AI学些什么,大概主要在布局阶段吧。模拟出来的结果
让人知道不同布局下哪边才是最大的大场。
用这角度思考很好理解为什么AI通常不会把人类定石下完,因为定石
的每步交换都是只看"区域"的两分而较少考虑全局,而每步价值可能
是递减的,比方说占空角可能价值20目,挂角可能值15目,再下一步
可能只剩10目,所以AI可能挂完就手拔了,因为外面有更大的点(AI
理解为胜率更高)
再来就是不同局面下先手价值多大或什么时候可以手拔也是可以跟AI
学习判断的。不管AI互下或跟人下的谱常常就是一直手拔,有时做些
区域被认为损目的交换就是为了抢先手。这次觉得柯洁很厉害的点就
是三盘似乎都不像上次李世石那么被动,他很努力在各种情势中设法
脱先,避免局势完全被电脑带着走,但可惜实力有差距
想想真要对人类学棋更有意义的话可能还是要人类和AI对弈。从AI逻
辑来想,他的胜负手或官子都和人类理解的最佳下法有差异,而且对
人下棋的逻辑来说是没什么帮助的。比方说收官吧,人类落后时仍会
下最佳解(最大官子)等待机会,但对AI来说他早就预见这样收必败,
胜率很低。所以AI互下时落后方AI的选点可能是人类一看明显没棋又
损目的送菜(对AI来说送菜的点可能他模拟时才有胜机),而领先方AI
可能判断大优势所以一直退让也一样在损目,这种时候两边都不是下
最佳解,那自然就不一定值得学
这次放出的AI对奕谱大概都是挑过的,猜测应该都是挑选全盘两方估
计胜率维持相近或是有胜率倒转的才较有可看性。不然很多AI对奕的
谱应该是一面倒,落后方不断用无理手测试然后越亏越多胜率不断被
拉开后投子
作者: aegis43210 (宇宙)   2017-05-27 23:10:00
意思就是对手愈强,展现出来的棋谱素质也就愈高但十盘棋谱素质高到几乎没有棋手懂,棋感差太多了
作者: HeterCompute (异质运算)   2017-05-27 23:16:00
我的看法跟你不一样 序盘也没办法学AI,因为你不知道他后续的下法,学都无从学起,只能说境界真的差太多
作者: LeeSeDol (啧啧...)   2017-05-27 23:18:00
如果明后年的布局跟今天差异很大,新手新型超多,算不算学到?
作者: toya123 (雷姆在我床上 闭嘴)   2017-05-27 23:20:00
能学是必然的 只是能学得而且能够理解应该是少数中的少数就跟人一样 每个人出生就有差异了 总有几个人是特别能够对图形理解分析较强 而且计算能力好的 不过这样的人大多不是在玩围棋罢了
作者: sadmonkey (下雨天)   2017-05-27 23:23:00
AG每天下成千上万盘棋要怎么挑?最多就是让黄博士针对
作者: HeterCompute (异质运算)   2017-05-27 23:23:00
每个定石都是好几十个变化然后妥协出来的,要改变就是要把他一整套学起来,不然你只模仿他那一步,别人
作者: chris610020 (可悲的阿明)   2017-05-27 23:24:00
这就好像人刚刚发现日心说,AI突然丢个相对论出来^类
作者: HeterCompute (异质运算)   2017-05-27 23:24:00
随便变招,你根本不会用,更不要说他那千变万化的手拔
作者: sadmonkey (下雨天)   2017-05-27 23:24:00
不同开局前几步大概选一下,更有可能就是随机选出来
作者: HeterCompute (异质运算)   2017-05-27 23:25:00
楼上比喻正确,连微积分都不会,根本看不懂相对论怎么回事还有很重要的一点是,黑棋现在很明显是贴目过重如果没有胜率表,你根本不知道AG现在到底是在拼命还
作者: sadmonkey (下雨天)   2017-05-27 23:26:00
去年古力赛后有帮AG三盘自我对战快棋来探讨,当时就已
作者: HeterCompute (异质运算)   2017-05-27 23:26:00
是在下本手,搞不好他只是想试试看,你拿去照抄根本
作者: sadmonkey (下雨天)   2017-05-27 23:27:00
经有些招法看不太懂或是需要耗费大量时间才能解读
作者: HeterCompute (异质运算)   2017-05-27 23:27:00
东施效颦
作者: sadmonkey (下雨天)   2017-05-27 23:28:00
基本上这五十盘就像无字天书一样,是拿来供不是拿来用
作者: toya123 (雷姆在我床上 闭嘴)   2017-05-27 23:29:00
很多布局跟套路也是我们照着古人的下法发展出自己的下法要说完全没用到不至于 棋手原本就是要多下才有棋感 只是你要完全吃透才用那才是不可能的事情 都没试怎么知道如何最适合的运用方式
作者: HeterCompute (异质运算)   2017-05-27 23:45:00
是啊,是重复出现,代表一定有理论可以解释他,只是境界差太多,真的不知道从何学起回t大,你不吃透到一定程度,就如同邯郸学步,没下个数个月,根本不敢拿出来下
楼主: ilw4e (可以吃吗?)   2017-05-27 23:49:00
其实围棋原本就这样阿,流行布局或下法不是都高段开始下,
作者: toya123 (雷姆在我床上 闭嘴)   2017-05-27 23:49:00
这么跟你说好了 就棋手而言你要完全的理解阿法狗是不太
作者: toya123 (雷姆在我床上 闭嘴)   2017-05-27 23:50:00
可能的事 但是就部分的套路来讲 可能有人了解了阿法狗的布局 有的人了解他的部分套路 当这些人拿着这些新套路或新布局交手 经过了很多棋局就发展出我们认定的新的棋理 从以前到现在都是如此 我们原本的学习就是从模仿棋谱开始 以前可以这样学习 到现在也是可以的
作者: walkwall (会走路的墙)   2017-05-27 23:55:00
如果AG真的20级 硬要讲解就类似初学者讲解高手对战一样所以最可能讲解的 理应是棋力最高的人或其他AI
楼主: ilw4e (可以吃吗?)   2017-05-27 23:58:00
摸透本来就是高段的事啊,就像业余的去看职业谱常常也是记套路,几个敢说真的搞懂全部变化?:D
作者: Uizmp (黑袍法师)   2017-05-28 00:00:00
所以柯洁能和Deepmind人员联合探讨这三盘棋 应该很有价值
作者: LeeSeDol (啧啧...)   2017-05-28 00:00:00
所以到底要不要讲解、要不要研究,如果答案是要,那我真的不了解先笃定说学不来的用意是什么?又不是要学到能赢alphago,只要用这些招能让胜率提高,那就够了
楼主: ilw4e (可以吃吗?)   2017-05-28 00:01:00
就是能理解到为什么这样下胜率可能高就好,如果自己试发现胜率反而更低那就果断放弃就好XD
作者: HeterCompute (异质运算)   2017-05-28 00:02:00
当然要讲解 要研究啊,只是你看小目二尖高跳还是没什么人下,等到数年之后,大家都摸个大概之后,传到我们业余也大概明白之后,就是大家都下的时候啦只是现在alphago如果什么都不跟你交流,你自己摸真的什么也不懂啊
楼主: ilw4e (可以吃吗?)   2017-05-28 00:03:00
就像柯洁最近一直下三三一定也研究过觉得那样应该不亏阿
作者: walkwall (会走路的墙)   2017-05-28 00:04:00
其实机器学习也有一个新方向是追求模型的"解释能力"
作者: HeterCompute (异质运算)   2017-05-28 00:04:00
因为三三好理解啊,但是小目二尖高跳怎么理解?
作者: LeeSeDol (啧啧...)   2017-05-28 00:05:00
论文公布后应该会有十个版本的伪物,别担心没得印证
作者: walkwall (会走路的墙)   2017-05-28 00:05:00
所以未来AI往"能讲解" 这方向发展也是有可能的
作者: CGary (下雨天也挺浪漫的)   2017-05-28 03:43:00
我本来以为DM会把这整块Open source, 结果只是发布论文...有点意外就是了
作者: sethero5 (罗莉仔)   2017-05-28 06:15:00
因为阿发狗的程式是可以变化后套用在其他领域的,谷歌不太可能释出嚷大家抄。
作者: letudiant   2017-05-28 07:22:00
小目二间高跳常常可以用小目二间高挂来手割 比起其它的一些新手可能算还好吧
作者: jpwd (jpwd)   2017-05-28 08:21:00
只能当棋谱是太玄神经了,懂围棋的反而看不懂。
作者: aegis43210 (宇宙)   2017-05-28 17:18:00
所以现在能了解google和deepmind的苦心和决断力他们不办这个人机大战2.0,让全世界看到现在的alphago已经无懈可击、近乎完美,全世界会认同alphago吗?会认同这些乍看之下完全无法理解的自战棋谱吗?
楼主: ilw4e (可以吃吗?)   2017-05-28 17:28:00
早就认同了吧,去年Master那60盘就知道差距了

Links booklink

Contact Us: admin [ a t ] ucptt.com