Re: [闲聊] Master已经突破人类围棋运算的极限了吗?

楼主: a127 (毛萝卜)   2017-01-05 12:42:20
※ 引述《Emerson158 (红豆 X 八嘎 X 乌鲁赛)》之铭言:
: 文章中如此写道
: 虽知道早有AI战倒人类高手群的一天, 自从AlphaGo惊艳表现开始
: 只是没想到这么快
: 下一步真的要挑战星海争霸了吗?
: 这是即时战略,感觉有点恐怖啊..
个人只是看过一些简报介绍,
但我觉得阿发狗的压倒性实力应该没那么绝望才对。
以前西洋棋被电脑演算直接暴力破解,
原因在于合法步少,对手的下一手反制只有2X步可能,
围棋的合法步多,前几手对手的反制有200步以上的可能。
然后西洋棋的好步就是成功的杀死对手的棋子+国王,
围棋的好步众说纷纭,就连布局来说不同的棋手就有各自不同的审美观。
虽然人类已经神乎其技的知道自己的布局在争夺N个目的地,
但两个不同的N相比起来,还是会很微妙的难以判断哪方优劣。
所以围棋比赛没有足够时间被暴力破解,
于是就变成阿发狗利用评价网络来建立围棋的审美观,
也就是把人类棋手应对的"好步"记起来,
利用这些好步跟有限的计算来击倒对手。
原本我在想既然喂养阿发狗的食物来源也是人类创造的,
那么阿发狗为什么会这么容易的击败世界顶尖的好手呢?
我在猜测其实职业棋手一场比赛其实"好步"的数量没那么多,
相较阿发狗则是利用他的评价网络希望他每一手都是好步(但可能也是部分而已)
会有这种猜测是这五十场胜利之中,其实有几场是几目的胜负,
而且都是在前中期阿发狗被评论大幅领先,在后面被人类追上。
我认为会有这种异常状况出现,可能在于一部分的赛局都以投子结束,
等于在最后收官阶段给阿发狗喂养的资料不够多,
因此目前人类在后期的计算跟审美仍然略优于阿发狗的关系。
作者: flysonics (飞音)   2017-01-05 12:45:00
AI如果要架构在RTS上面的话 应该一开始只能先做快攻吧不然到了后期兵一多又是即时的 NN应该是来不及算 就算他是用另一个策略weighting也一样
作者: intela60474 (Alber)   2017-01-05 12:46:00
两只阿发狗无限对弈 就没有你说的问题
作者: WindSpread (阳だまりの诗)   2017-01-05 12:47:00
听说master版本的alphago训练时用的棋谱全是自己跟自
作者: intela60474 (Alber)   2017-01-05 12:47:00
不用怕来不及算 参数训练好后面只是代入解数学
作者: tsubasawolfy (悠久の翼)   2017-01-05 12:47:00
他平常就自己跟自己下了...去年的资料不是都有说
作者: xxxxae86 (非洲大草原)   2017-01-05 12:47:00
他们一定做过像楼上说的事情
作者: Aatrox (the Darkin Blade)   2017-01-05 12:47:00
你讲的是旧版狗 新版狗完全没看人类棋谱
作者: flysonics (飞音)   2017-01-05 12:48:00
评价网络还是要即时算胜率啊
作者: xxxxae86 (非洲大草原)   2017-01-05 12:48:00
结果还是要找人来debug你就知道跟人类对弈才是下一步的重点
作者: flysonics (飞音)   2017-01-05 12:49:00
NN只是拿来学习强者棋手的好步而已
作者: intela60474 (Alber)   2017-01-05 12:49:00
人类后期能拉回应该是因为前期资讯对人类来说不足NN太粗糙 1万层NN来训练差不多
作者: flysonics (飞音)   2017-01-05 12:50:00
一个拿AI来练蛊的概念wwww
作者: intela60474 (Alber)   2017-01-05 12:52:00
一万层是随口说说 总之是要多层 =深度学习
作者: sarevork (蚰梜黎h郎)   2017-01-05 12:53:00
正常来说是越来越绝望 因为人会累XDDDDDD
作者: flysonics (飞音)   2017-01-05 12:53:00
....NN一直都没有人只玩一层的 你去看NN的paper
作者: intela60474 (Alber)   2017-01-05 12:54:00
应该说AI每下一盘就会变强一点
作者: flysonics (飞音)   2017-01-05 12:54:00
会改深度学习这个名词一来是weighting的方式有经过简化二来是他们说paper只要挂NN就会被当垃圾 只好换个名词
作者: a1s2d342001 (风吹裤子飞)   2017-01-05 12:56:00
机器一天下的数量就比人一生还多了
作者: meredith001 (ああああ ̄▽ ̄)   2017-01-05 12:56:00
原来如此 那赌神开示过了 先用500局来欺骗电脑
作者: intela60474 (Alber)   2017-01-05 12:57:00
500局在训练资料里占的比重微乎其微我们在这里推文的当下 已经不知道训练几局去了
作者: sarevork (蚰梜黎h郎)   2017-01-05 12:59:00
大概一个月的封闭对弈等于50年的人类对弈吧
作者: henry1234562 (亨利二十三)   2017-01-05 13:08:00
这篇最大错误是 认为赢得目数少是ai经验少ai只有赢和输 没有赢多跟赢少当一步棋会让他从80%赢20目变90%赢半目 ai就会走这也是为什么一堆选手中盘认输 当他看到ai处处退让自己算一算就知道 剩下怎么样都输定了也就是 ai后面让你追 是因为你追了还是输
作者: a774532087 (脏灰色去势)   2017-01-05 13:20:00
推henry大的论点
作者: f222051618 ( 珍 珠 奶 茶 )   2017-01-05 13:20:00
楼楼上突破我盲点了
作者: shintz (Snow halation)   2017-01-05 13:36:00
AI:来追我阿 阿哈哈哈~~
作者: suhorng ( )   2017-01-05 13:38:00
AlphaGo 跟自己对弈的场数超级多啊XD
作者: joy3252355 (九月 ~*)   2017-01-05 13:42:00
只有我觉得这篇原po有错误认知吗 ???
作者: oldriver (oldriver)   2017-01-05 13:48:00
alphago都开影分身对打练经验值 人类已经不重要啦
作者: fei6409 (fei6409)   2017-01-05 13:58:00
最后一段看来是搞错什么了 XD
作者: henry1234562 (亨利二十三)   2017-01-05 14:00:00
不是只有你认为 这篇错的很多
作者: shinwind (风)   2017-01-05 14:10:00
这篇就是标准人类的观点.就连学习这件事情上都是
作者: s101881 (PIBAO)   2017-01-05 14:38:00
这篇不对吧
作者: gmoz ( This can't do that. )   2017-01-05 15:17:00
....
作者: tiefblau (tiefblau)   2017-01-05 16:33:00
只看过一些简报就不要出来丢脸
作者: coldfirecf (66%的懊悔)   2017-01-05 18:22:00
完全搞错原理的不要丢脸
作者: gy3310   2017-01-05 21:39:00
搞错太多了

Links booklink

Contact Us: admin [ a t ] ucptt.com