Re: [闲聊] Master已经突破人类围棋运算的极限了吗? a127 PTT批踢踢实业坊

Re: [闲聊] Master已经突破人类围棋运算的极限了吗?

楼主: a127 (毛萝卜) 2017-01-05 12:42:20

※ 引述《Emerson158 (红豆 X 八嘎 X 乌鲁赛)》之铭言：
: 文章中如此写道
: 虽知道早有AI战倒人类高手群的一天, 自从AlphaGo惊艳表现开始
: 只是没想到这么快
: 下一步真的要挑战星海争霸了吗?
: 这是即时战略,感觉有点恐怖啊..
个人只是看过一些简报介绍，
但我觉得阿发狗的压倒性实力应该没那么绝望才对。
以前西洋棋被电脑演算直接暴力破解，
原因在于合法步少，对手的下一手反制只有2X步可能，
围棋的合法步多，前几手对手的反制有200步以上的可能。
然后西洋棋的好步就是成功的杀死对手的棋子+国王，
围棋的好步众说纷纭，就连布局来说不同的棋手就有各自不同的审美观。
虽然人类已经神乎其技的知道自己的布局在争夺N个目的地，
但两个不同的N相比起来，还是会很微妙的难以判断哪方优劣。
所以围棋比赛没有足够时间被暴力破解，
于是就变成阿发狗利用评价网络来建立围棋的审美观，
也就是把人类棋手应对的"好步"记起来，
利用这些好步跟有限的计算来击倒对手。
原本我在想既然喂养阿发狗的食物来源也是人类创造的，
那么阿发狗为什么会这么容易的击败世界顶尖的好手呢?
我在猜测其实职业棋手一场比赛其实"好步"的数量没那么多，
相较阿发狗则是利用他的评价网络希望他每一手都是好步(但可能也是部分而已)
会有这种猜测是这五十场胜利之中，其实有几场是几目的胜负，
而且都是在前中期阿发狗被评论大幅领先，在后面被人类追上。
我认为会有这种异常状况出现，可能在于一部分的赛局都以投子结束，
等于在最后收官阶段给阿发狗喂养的资料不够多，
因此目前人类在后期的计算跟审美仍然略优于阿发狗的关系。

作者: flysonics (飞音) 2017-01-05 12:45:00

AI如果要架构在RTS上面的话应该一开始只能先做快攻吧不然到了后期兵一多又是即时的 NN应该是来不及算就算他是用另一个策略weighting也一样

作者: intela60474 (Alber) 2017-01-05 12:46:00

两只阿发狗无限对弈就没有你说的问题

作者: WindSpread (阳だまりの诗) 2017-01-05 12:47:00

听说master版本的alphago训练时用的棋谱全是自己跟自

作者: intela60474 (Alber) 2017-01-05 12:47:00

不用怕来不及算参数训练好后面只是代入解数学

作者: tsubasawolfy (悠久の翼) 2017-01-05 12:47:00

他平常就自己跟自己下了...去年的资料不是都有说

作者: xxxxae86 (éžæ´²å¤§è‰åŽŸ) 2017-01-05 12:47:00

他们一定做过像楼上说的事情

作者: Aatrox (the Darkin Blade) 2017-01-05 12:47:00

你讲的是旧版狗新版狗完全没看人类棋谱

作者: flysonics (飞音) 2017-01-05 12:48:00

评价网络还是要即时算胜率啊

作者: xxxxae86 (éžæ´²å¤§è‰åŽŸ) 2017-01-05 12:48:00

结果还是要找人来debug你就知道跟人类对弈才是下一步的重点

作者: flysonics (飞音) 2017-01-05 12:49:00

NN只是拿来学习强者棋手的好步而已

作者: intela60474 (Alber) 2017-01-05 12:49:00

人类后期能拉回应该是因为前期资讯对人类来说不足NN太粗糙 1万层NN来训练差不多

作者: flysonics (飞音) 2017-01-05 12:50:00

一个拿AI来练蛊的概念wwww

作者: intela60474 (Alber) 2017-01-05 12:52:00

一万层是随口说说总之是要多层 =深度学习

作者: sarevork (蚰梜黎h郎) 2017-01-05 12:53:00

正常来说是越来越绝望因为人会累XDDDDDD

作者: flysonics (飞音) 2017-01-05 12:53:00

....NN一直都没有人只玩一层的你去看NN的paper

作者: intela60474 (Alber) 2017-01-05 12:54:00

应该说AI每下一盘就会变强一点

作者: flysonics (飞音) 2017-01-05 12:54:00

会改深度学习这个名词一来是weighting的方式有经过简化二来是他们说paper只要挂NN就会被当垃圾只好换个名词

作者: a1s2d342001 (风吹裤子飞) 2017-01-05 12:56:00

机器一天下的数量就比人一生还多了

作者: meredith001 (ああああ￣▽￣) 2017-01-05 12:56:00

原来如此那赌神开示过了先用500局来欺骗电脑

作者: intela60474 (Alber) 2017-01-05 12:57:00

500局在训练资料里占的比重微乎其微我们在这里推文的当下已经不知道训练几局去了

作者: sarevork (蚰梜黎h郎) 2017-01-05 12:59:00

大概一个月的封闭对弈等于50年的人类对弈吧

作者: henry1234562 (äº¨åˆ©äºŒåä¸‰) 2017-01-05 13:08:00

这篇最大错误是认为赢得目数少是ai经验少ai只有赢和输没有赢多跟赢少当一步棋会让他从80%赢20目变90%赢半目 ai就会走这也是为什么一堆选手中盘认输当他看到ai处处退让自己算一算就知道剩下怎么样都输定了也就是 ai后面让你追是因为你追了还是输

作者: a774532087 (脏灰色去势) 2017-01-05 13:20:00

推henry大的论点

作者: f222051618 ( 珍珠奶茶 ) 2017-01-05 13:20:00

楼楼上突破我盲点了

作者: shintz (Snow halation) 2017-01-05 13:36:00

AI:来追我阿阿哈哈哈~~

作者: suhorng ( ) 2017-01-05 13:38:00

AlphaGo 跟自己对弈的场数超级多啊XD

作者: joy3252355 (九月 ~*) 2017-01-05 13:42:00

只有我觉得这篇原po有错误认知吗 ???

作者: oldriver (oldriver) 2017-01-05 13:48:00

alphago都开影分身对打练经验值人类已经不重要啦

作者: fei6409 (fei6409) 2017-01-05 13:58:00

最后一段看来是搞错什么了 XD

不是只有你认为这篇错的很多

作者: shinwind (风) 2017-01-05 14:10:00

这篇就是标准人类的观点.就连学习这件事情上都是

作者: s101881 (PIBAO) 2017-01-05 14:38:00

这篇不对吧

作者: gmoz ( This can't do that. ) 2017-01-05 15:17:00

....

作者: tiefblau (tiefblau) 2017-01-05 16:33:00

只看过一些简报就不要出来丢脸

作者: coldfirecf (66%的懊悔) 2017-01-05 18:22:00

完全搞错原理的不要丢脸

作者: gy3310 2017-01-05 21:39:00

搞错太多了

继续阅读

Re: [闲聊] 动画疯新上架偶像大师灰姑娘女孩WOODOM [问题] Nico新版接口如何看日文留言StarTouching [讨论] 阿法狗和未来shinwind Re: [闲聊] 设定上咏唱时间过长的攻击技Senkanseiki Re: [闲聊] 动画疯新上架偶像大师灰姑娘女孩MayBeSoft Re: [闲聊] master会召唤出谁（有圣杯雷e04a8678 [闲聊] 加速世界要怎样才能超越刀剑神遇WOODOM Re: [闲聊] 要世界末日了，该怎么处置心爱的人?mykey8585 [闲聊] 要世界末日了，该怎么处置心爱的人?SuperSg [闲聊] 百乐魔擦钢珠笔Xavy

【VR】半径10cm以内の超至近距離で三上悠亜に逆痴●されたい？されたいでしょ？

一般男女モニタリングAV 巨乳の人妻さん！タオル一枚男湯でおち○ぽ洗い屋体験してみませんか？年下男性客のフル勃起チ○ポに囲まれ戸惑いながらもしごいてしゃぶってザーメン抜きまくり！過激なミッションでオマ○コが火照ってしまいそのまま浮気乱交で生中出し！総発射25発

アナタの五感を刺激する安齋ららのシコシコサポートラグジュアリー Jcupのエロスで脳を満たすASMR主観、神の乳スペシャル

初アナル姦人妻30人20時間マジイキ・2穴イキ・絶頂痙攣！！魂の撮り下ろし10作品まとめて福袋

私がナースになった理由は…無抵抗な男に跨り好きなだけ犯せるから。小島みなみ