楼主:
a127 (毛萝卜)
2017-01-05 12:42:20※ 引述《Emerson158 (红豆 X 八嘎 X 乌鲁赛)》之铭言:
: 文章中如此写道
: 虽知道早有AI战倒人类高手群的一天, 自从AlphaGo惊艳表现开始
: 只是没想到这么快
: 下一步真的要挑战星海争霸了吗?
: 这是即时战略,感觉有点恐怖啊..
个人只是看过一些简报介绍,
但我觉得阿发狗的压倒性实力应该没那么绝望才对。
以前西洋棋被电脑演算直接暴力破解,
原因在于合法步少,对手的下一手反制只有2X步可能,
围棋的合法步多,前几手对手的反制有200步以上的可能。
然后西洋棋的好步就是成功的杀死对手的棋子+国王,
围棋的好步众说纷纭,就连布局来说不同的棋手就有各自不同的审美观。
虽然人类已经神乎其技的知道自己的布局在争夺N个目的地,
但两个不同的N相比起来,还是会很微妙的难以判断哪方优劣。
所以围棋比赛没有足够时间被暴力破解,
于是就变成阿发狗利用评价网络来建立围棋的审美观,
也就是把人类棋手应对的"好步"记起来,
利用这些好步跟有限的计算来击倒对手。
原本我在想既然喂养阿发狗的食物来源也是人类创造的,
那么阿发狗为什么会这么容易的击败世界顶尖的好手呢?
我在猜测其实职业棋手一场比赛其实"好步"的数量没那么多,
相较阿发狗则是利用他的评价网络希望他每一手都是好步(但可能也是部分而已)
会有这种猜测是这五十场胜利之中,其实有几场是几目的胜负,
而且都是在前中期阿发狗被评论大幅领先,在后面被人类追上。
我认为会有这种异常状况出现,可能在于一部分的赛局都以投子结束,
等于在最后收官阶段给阿发狗喂养的资料不够多,
因此目前人类在后期的计算跟审美仍然略优于阿发狗的关系。
AI如果要架构在RTS上面的话 应该一开始只能先做快攻吧不然到了后期兵一多又是即时的 NN应该是来不及算 就算他是用另一个策略weighting也一样
听说master版本的alphago训练时用的棋谱全是自己跟自
作者:
xxxxae86 (éžæ´²å¤§è‰åŽŸ)
2017-01-05 12:47:00他们一定做过像楼上说的事情
作者:
Aatrox (the Darkin Blade)
2017-01-05 12:47:00你讲的是旧版狗 新版狗完全没看人类棋谱
作者:
xxxxae86 (éžæ´²å¤§è‰åŽŸ)
2017-01-05 12:48:00结果还是要找人来debug你就知道跟人类对弈才是下一步的重点
人类后期能拉回应该是因为前期资讯对人类来说不足NN太粗糙 1万层NN来训练差不多
作者:
sarevork (蚰梜黎h郎)
2017-01-05 12:53:00正常来说是越来越绝望 因为人会累XDDDDDD
....NN一直都没有人只玩一层的 你去看NN的paper
会改深度学习这个名词一来是weighting的方式有经过简化二来是他们说paper只要挂NN就会被当垃圾 只好换个名词
500局在训练资料里占的比重微乎其微我们在这里推文的当下 已经不知道训练几局去了
作者:
sarevork (蚰梜黎h郎)
2017-01-05 12:59:00大概一个月的封闭对弈等于50年的人类对弈吧
这篇最大错误是 认为赢得目数少是ai经验少ai只有赢和输 没有赢多跟赢少当一步棋会让他从80%赢20目变90%赢半目 ai就会走这也是为什么一堆选手中盘认输 当他看到ai处处退让自己算一算就知道 剩下怎么样都输定了也就是 ai后面让你追 是因为你追了还是输
作者:
shintz (Snow halation)
2017-01-05 13:36:00AI:来追我阿 阿哈哈哈~~
作者:
suhorng ( )
2017-01-05 13:38:00AlphaGo 跟自己对弈的场数超级多啊XD
作者:
oldriver (oldriver)
2017-01-05 13:48:00alphago都开影分身对打练经验值 人类已经不重要啦
作者:
fei6409 (fei6409)
2017-01-05 13:58:00最后一段看来是搞错什么了 XD
作者:
s101881 (PIBAO)
2017-01-05 14:38:00这篇不对吧
作者:
gmoz ( This can't do that. )
2017-01-05 15:17:00....
作者:
tiefblau (tiefblau)
2017-01-05 16:33:00只看过一些简报就不要出来丢脸
作者: gy3310 2017-01-05 21:39:00
搞错太多了