[心情] 李世石 Go! Go! Go!

楼主: bbbtri (cycling)   2016-03-11 23:59:20
本来想问这里没有人有可以出来解释一下这篇(讲AlphaGo用的算法)
http://benkampha.us/posts/2016-03-11.html
(不过不知道为什么, 连结好像失效了?)
只大概看了一下, 因为连什么是hand coded evaluation都一头雾水啊 XD
其中提到两种算法, 一组叫policy network,用来模仿人类的棋步, 很妙
另一组是value network,用以判断一个棋步有多少价值(应该无关好坏,而是目数)
前者还有分阶段, 先supervised后reinforcement
而后者并不是放手让电脑自行去绕,而是有给点指示
大概是这样, 不过我更想知道这个convolutional neural networks是什么?
和节点的类神经网络有什么不一样啊?
希望版上有神人可以解答 @_@"
以下是我自己昨天看棋的感想:
做为一个曾经的棋迷, 我在2004-2008年间看过很多棋赛
那时会和朋友用MSN Live讨论的比赛(自LGS、棋圣道场、幽玄之间等的转播)
或从奇谱士找我们有兴趣的旧谱来讨论
感觉身为棋迷很幸福啊, 因为网络上资源相当丰富
论坛人多, 又值棋界动荡不安, 很多八卦可看XD
比方说, 在当时个性和作风就很妙的小李
那时还是大李比较强, 但已压不住他的风头
所以小李在09年突然说要停职时, 虽然我已渐渐不太看棋了, 还是很错愕
他一直都有惊人之举, 但当时正是他全盛的时候啊!
没有职业棋手会在自己刚27岁, 迎上顶峰的时候说要“暂停”!
那时应该是所有人都看坏一年多后回来的他
觉得没有棋士
作者: arnold3 (no)   2016-03-12 00:03:00
人类若只能还在用形容词来描述棋局时 注定离电脑一大截
作者: notmuchmoney (真的不错....)   2016-03-12 00:15:00
赛前李世石对环境也没太多要求 也许没料到挑战如此巨大
作者: fgkor123 (n(N))   2016-03-12 00:23:00
作者: Rubio5566 (卢比欧)   2016-03-12 00:25:00
第二篇连结失效了
作者: fgkor123 (n(N))   2016-03-12 00:27:00
http://dataunion.org/11692.html 正常阿QQ好像少l
作者: ginstein (迈向学术之路)   2016-03-12 00:29:00
作者: fgkor123 (n(N))   2016-03-12 00:31:00
那两篇是架构cnblogs.com/fengfenggirl/p/cnn_implement.html这篇只谈CNN,附程式码和github连结
作者: sadmonkey (下雨天)   2016-03-12 00:40:00
分享一下个人对算法的理解,AG每步棋下棋模式就像是一位长期练习后的业余棋手,已经懂得每步棋要下时大约可以下的哪五步棋比较好,而这时他会请一千名跟他同等级业余棋手分五组两两配对来对那五步棋开始下,直到下完这一千盘统计这五步哪步胜率高,最后就决定下那步。而AG的长期练习就是不断的跟自己同等级的人下,每步棋依据前面的下法,每局下完后会依据胜负检讨黑方白方谁下的好,并就依胜负加权那方中间下过的每步棋,而且他记忆力惊人永不忘记,体力惊人永不会累,并永远可以找到一位跟他一模一样棋力的人下,经过上千万棋局的自我修练后来跟人类下棋。只要他检讨棋局的方向正确,他就会一直的进步下去,而
作者: NaoGaTsu (那欧卡兹)   2016-03-12 00:42:00
简单说就是鸣人的影分身之术外挂练等法。(无误
作者: fgkor123 (n(N))   2016-03-12 00:43:00
作者: sadmonkey (下雨天)   2016-03-12 00:44:00
过去即使用影分身可能要练一百年,AG找到精神时光屋所以练了四年打败樊麾,多练半年打败李世石
作者: wadashi1 (阿拉丁)   2016-03-12 00:47:00
我去爬了,早在13年前黄士杰就做过电脑围棋打劫的策略论
作者: fgkor123 (n(N))   2016-03-12 00:47:00
明显你网址多了/posts XD
作者: wadashi1 (阿拉丁)   2016-03-12 00:48:00
文.http://goo.gl/utCkwl 接下来李世石要用打劫的方法对
作者: sadmonkey (下雨天)   2016-03-12 00:49:00
用deepmind来研究围棋是近四五年才开始成立的公司
作者: wadashi1 (阿拉丁)   2016-03-12 00:49:00
对阿法GO,正好可以见论电脑围棋对打劫的方法。李世石究竟会不会是自寻困扰呢?毕竟现在的电脑运算太快了!
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 00:53:00
deepmind打败职棋的棋风不是aja 我也没有说AG=DeepmindAG在弈城的帐号也可以是aja的帐号 这是多对一的概念#1MswLK3O推论某些局是AG下的
作者: zelkova (*〞︶〝*)   2016-03-12 00:59:00
AG有没有在弈城下过棋就是一个问题了再来才是AG的帐号是什么
作者: liaon98 (liaon98)   2016-03-12 01:01:00
不过AG去下网络围棋锻炼 也是个不错的方法吧
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:06:00
7372这篇推论AG有在弈城下过 载体是deepmind 80%+是真的
作者: zelkova (*〞︶〝*)   2016-03-12 01:15:00
7373呢? 80%又哪来的 还有人说99%呢
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:22:00
7373也是说连胜应该不是aja下的有问题吗
作者: zelkova (*〞︶〝*)   2016-03-12 01:29:00
你可能没理解文章 他是说 "你可以这么说 但我不这么认为"
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:31:00
他说"这个状况,说明了应该有位职业棋手在操刀"所以他说不是aja下的没错呀
作者: zelkova (*〞︶〝*)   2016-03-12 01:32:00
后面那段是什么 可以唸出来吗??
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:36:00
不可能达成那么惊人的(9d)连胜成就
作者: zelkova (*〞︶〝*)   2016-03-12 01:38:00
我觉得你很有当记者的浅力..“这个状况,说明了应该有位职业棋手在操刀,从 Alphago的棋感觉不出来,可以在九段达成那么惊人的连胜记录,除非他有所谓的:遇强则强,遇弱则弱的状况,所以我觉得应该是有职业棋手接手了 Aja Huang 的号在下,而不是Alphago 在下。”
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:42:00
所以确实他认为不是aja下的没错呀 要9d连胜也接近世石了aja有必要或有能力请到这种棋手来帮他代打或测试吗
作者: zelkova (*〞︶〝*)   2016-03-12 01:44:00
但是你没发现人家在分析的时候 都是持保留态度而不是把“AG在弈城的帐号...”挂在嘴边
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:44:00
而他前面也有说 如果之后公布是AG那他也认了 从前两战结
作者: zelkova (*〞︶〝*)   2016-03-12 01:45:00
这样跟那些在说这次有不打劫协议的人有什么差别
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:46:00
果看来 保守猜测是AG应该没问题吧说有不打劫协议是不承认真实 我不承认aja能连胜九段和7373这篇的想法一样 都是认同真实事实的行为
作者: zelkova (*〞︶〝*)   2016-03-12 01:51:00
虽然大家想法一样 但是结论完全不一样你高兴就好 恩 晚安
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 01:54:00
如果你认为aja能连胜九段 才是无异于不打劫协议派的人是潜力不是浅力 记者至少分得清楚这两个字
作者: zelkova (*〞︶〝*)   2016-03-12 08:19:00
你也没搞懂我意思 我没说aja一定能连胜九段 至少得有证据不然 柯洁怀疑有不打劫协议->网友说估狗有不打劫协议陈经怀疑deepmind就是AG->网民说AG就是用deepmind这中间哪里有差别? 最后还自己加个80% 完全就自己定论了
作者: TaiwanUp (以运动为本的道路环境)   2016-03-12 15:20:00
我有断句 不是在引用数据 不要搞文字狱

Links booklink

Contact Us: admin [ a t ] ucptt.com