Re: [闲聊] Master已经突破人类围棋运算的极限了吗?

楼主: Justice5566 (正义56)   2017-01-05 12:56:31
※ 引述《a127 (毛萝卜)》之铭言:
: ※ 引述《Emerson158 (红豆 X 八嘎 X 乌鲁赛)》之铭言:
: 个人只是看过一些简报介绍,
: 但我觉得阿发狗的压倒性实力应该没那么绝望才对。
: 以前西洋棋被电脑演算直接暴力破解,
: 原因在于合法步少,对手的下一手反制只有2X步可能,
: 围棋的合法步多,前几手对手的反制有200步以上的可能。
: 然后西洋棋的好步就是成功的杀死对手的棋子+国王,
: 围棋的好步众说纷纭,就连布局来说不同的棋手就有各自不同的审美观。
: 虽然人类已经神乎其技的知道自己的布局在争夺N个目的地,
: 但两个不同的N相比起来,还是会很微妙的难以判断哪方优劣。
: 所以围棋比赛没有足够时间被暴力破解,
: 于是就变成阿发狗利用评价网络来建立围棋的审美观,
: 也就是把人类棋手应对的"好步"记起来,
: 利用这些好步跟有限的计算来击倒对手。
: 原本我在想既然喂养阿发狗的食物来源也是人类创造的,
这段你搞错了
喂人类棋谱长大的是旧版的阿发狗
也就是去年跟李世石下的那只
去年那只在李世石第78步下出神之一手后整个错乱导致输棋
可能也是因为李那步超越了去年狗狗建立的理论
今年这只阿发狗是纯粹借由自我对局学习的
差别在于今年这只会在前期中棋下一些违反常理
甚至被认为是臭棋的棋步
但事后发现这些棋步都是神之一手
所以才很多职业棋士说新版阿发狗颠覆了传统围棋理论
: 那么阿发狗为什么会这么容易的击败世界顶尖的好手呢?
: 我在猜测其实职业棋手一场比赛其实"好步"的数量没那么多,
: 相较阿发狗则是利用他的评价网络希望他每一手都是好步(但可能也是部分而已)
: 会有这种猜测是这五十场胜利之中,其实有几场是几目的胜负,
: 而且都是在前中期阿发狗被评论大幅领先,在后面被人类追上。
: 我认为会有这种异常状况出现,可能在于一部分的赛局都以投子结束,
: 等于在最后收官阶段给阿发狗喂养的资料不够多,
: 因此目前人类在后期的计算跟审美仍然略优于阿发狗的关系。
这点你判断也是有问题
阿发狗中期赢很多 后期赢面变小的理由
主要是来自于他所设定的目标
对阿发狗来讲 赢半目跟赢100目都是赢
所以我不需要赢很多 只要保持一定赢就可以了
所以狗狗在稳定领先时会变得保守的理由就在这边
反观人类在获得优势时 常常想要扩大优势
但这个行为往往得不偿失
这就是电脑最强的地方 电脑完全没有情绪
他只往最高胜率的方向走 所以不容易犯错
作者: intela60474 (Alber)   2017-01-05 13:00:00
我觉得不是变保守而是后期资讯量对人类来说终于够了
作者: orze04 (orz)   2017-01-05 13:01:00
AlphaGo在后期会把一些还有变化的地方早早结束掉
作者: emptie ([ ])   2017-01-05 13:02:00
这就是我们学棋跟阿发狗最大的不同……我们会关注赢多少 他只会管有没有赢
作者: shadowblade (影刃)   2017-01-05 13:03:00
机器没有赌徒性格差很多
作者: a1234567289 (蛋包饭)   2017-01-05 13:03:00
和李世石打的那只也有自我对奕了吧
作者: orze04 (orz)   2017-01-05 13:03:00
人会犯错啊 又不可能像AI那么精准计算
作者: emptie ([ ])   2017-01-05 13:04:00
也不能说人的下法不对 因为我们怕失误 所以会希望能尽量多
作者: orze04 (orz)   2017-01-05 13:04:00
不能说错的 人也很难完整复制AI那套下法
作者: MikiSayaka (美树さやか)   2017-01-05 13:10:00
还有电脑的训练量就算是最强的职业棋士都难望项背...职业棋士没有办法 24x7 都在下棋... |||
作者: orze04 (orz)   2017-01-05 13:10:00
AlphaGo能那样下是因为它能发挥 人能不能发挥同样效力?
作者: MikiSayaka (美树さやか)   2017-01-05 13:11:00
AlphaGO 的着棋思路可能没有办法从内部结构去理解
作者: henry1234562 (亨利二十三)   2017-01-05 13:12:00
人类跟ai在下围棋的根本判断方式有不同虽然结果都是为了最大胜率 但过程差很多
作者: ADIE2 (ㄚ呆)   2017-01-05 13:16:00
现在看起来李世石真的是神之一手 可能是阿发狗最后一败
作者: dreamnook (亚龙)   2017-01-05 13:17:00
围棋理论也是建立在大量棋局的收敛经验谈上吧?
作者: shinwind (风)   2017-01-05 13:18:00
他前中期的下法.其实不是人类不懂..而是我们没办法判断这么宏观这样说好了.人类的观点 都在局部.=而阿法狗下的 都是宏观的胜利.其实人类也可以 只是...你无法像AI那样.中收尾不出错
作者: flysonics (飞音)   2017-01-05 13:20:00
"士杰读了Alpha狗万局练蛊棋局后 竟也成一代武林奇侠"这种套路感觉好像武侠小说wwww
作者: shinwind (风)   2017-01-05 13:25:00
其实看解说就能有这种感觉.有时候一个局部固定的定式解说就会说出这边会怎样下.但阿法狗就下一半 就不鸟了..跑出旁边下.
作者: zeyoshi (日阳旭)   2017-01-05 13:26:00
我觉得电脑预测的能力比人类高很多 所以判断是否需要收手或进攻的时间会变得相当准确
作者: loadingN (sarsaparilla)   2017-01-05 13:27:00
最大的优势应该是不会有太大的失误
作者: henry1234562 (亨利二十三)   2017-01-05 13:32:00
只是因为ai的目标单纯只放在赢而已ai在确定当前局面基本赢定后 就是不会再扩大优势
作者: shinwind (风)   2017-01-05 13:36:00
这也是为什么收宫会看到填自己目的情况XD
作者: wateryoo (阿水)   2017-01-05 13:41:00
专业推~
作者: seaEPC (没看见,我没看见 >_<)   2017-01-05 13:43:00
目前这个发展阶段能赢还是重点,不然AI目标要调整成尽可能赢越多目应该也不是问题,只是可能翻船机率稍大一点
作者: jupto (op)   2017-01-05 13:49:00
我觉得是因为AI预测能力高于人类 人类仅能不断扩大优势去确保自己的胜利机率 但AI可以不断地消除自己输棋的未来来确保自己的胜利 所以对于棋局的走向才会有所差异以程式的观点人类的思考模式是loop AI是递回
作者: blackwindy (黑色的风)   2017-01-05 13:53:00
loop跟递回一样阿...
作者: jupto (op)   2017-01-05 13:54:00
一个反著来 一个正面上 概念上有差啦
作者: blackwindy (黑色的风)   2017-01-05 13:54:00
差别只是递回会呼叫自己不要乱套用专有名词 那不是你想的那样最好笑的应该是 以往围棋大家都说人类有宏观视野 战略现在AI已经用实战证明那些只不过是屁 人类应该谦虚点
作者: zader (艦娘武藏我老婆)   2017-01-05 14:01:00
深层运算跟宏局观真的是赢不过电脑
作者: jupto (op)   2017-01-05 14:03:00
事实上什么宏观视野 战略人类自己都不了解那东西的本质结果使用模拟大脑运作方式AI就自己发展出来了
作者: orze04 (orz)   2017-01-05 14:08:00
递回可以用stack和loop做出来没错
作者: agag5123 (ag)   2017-01-05 14:21:00
区域不走完用机器的角度想可能是另一区的手价值更高吧即使当下这区放掉会损一些 也比不过另一区先下得的收获
作者: shinwind (风)   2017-01-05 14:24:00
其实这一部分也是很有趣
作者: agag5123 (ag)   2017-01-05 14:24:00
人可能都要下到显而易见才能判断价值高低 机器则看的早
作者: shinwind (风)   2017-01-05 14:25:00
这完全是判断格局的不同.没下完 未必是损
作者: agag5123 (ag)   2017-01-05 14:25:00
所以才会出现许多不能理解的神之一手
作者: sarspieya521 (HANA)   2017-01-05 14:36:00
光没有情绪这点来讲 真的很可怕
作者: agag5123 (ag)   2017-01-05 14:38:00
如果可以看狗对狗的棋谱 感觉会很可怕一直维持在胜率50左右的宏局作战 不知道长得怎样
作者: tsming (断水流大师兄)   2017-01-05 14:46:00
感觉该跪舔天网了XD
作者: grandzxcv (frogero)   2017-01-05 14:49:00
我看出人类对宇宙百害无一利,所以该毁灭人类
作者: weltschmerz (威尔特斯克˙闷死)   2017-01-05 14:50:00
所以新版的有出PAPER了吗? 我上次看的那篇有用到
作者: opmina (梦游吉他)   2017-01-05 14:50:00
两个ai的差异蛮有趣的
作者: weltschmerz (威尔特斯克˙闷死)   2017-01-05 14:51:00
人类经验做落点预测
作者: tsubasawolfy (悠久の翼)   2017-01-05 14:57:00
今天的Nature没有 只有新闻快报看看下礼拜吧
作者: davidyang1 (qq)   2017-01-05 15:10:00
我的看法跟你不一样
作者: lugiam (Anashisu)   2017-01-05 15:31:00
有那个版面对这个议题有深入讨论吗 想拜见一下
作者: jupto (op)   2017-01-05 15:37:00
看起来目前的狗狗没有针对对手个体行为做预测与调整也就是不管给他谁当对手他的思考方式都一样如果未来要出专门玩猜拳的狗狗 应该就会发展出个体行为分析与预测的狗狗了
作者: z101924512   2017-01-05 15:42:00
换句话说,狗已经领悟围棋本质,根本不在乎对手....好像更厉害...
作者: jupto (op)   2017-01-05 15:46:00
这要看人 有人觉得下棋重在两个人之前的互相影响如何打乱对方的节奏 如何不被对方打乱节奏但是狗狗就只是在想怎么放子可以赢
作者: moonlind (又多了敷脸卡跟觅食卡了~)   2017-01-05 16:09:00
究竟是从哪里流出:这个AlphaGO是完全自我对弈出来的官方也只说新版 甚至没讲如何新版 怎么脑补的?去年三月 AlphaGO就有过跳脱思维演出了 你也无法否定他在一年的时间内 透过自我对弈 又删除了不少人类棋谱的可能性啊
作者: goenitzx   2017-01-05 16:12:00
那AlphaGO2只要跟AlphaGO1对弈练习...
作者: zseineo (Zany)   2017-01-05 16:19:00
从新版那个字眼联想出来的,没有正式说法
作者: davidpanda (panda)   2017-01-05 16:19:00
可是自我对弈的棋谱也是从上一版的AlphaGo来的吧?所以多少还是需要采用人类棋手的智慧?不太相信他们可以从全部随机开始train出这版alphaGo..
楼主: Justice5566 (正义56)   2017-01-05 16:23:00
训练方式是go板看到的陆闻写的 姑妄听之吧
作者: orion (火星上的人类学家)   2017-01-05 16:26:00
因为去年Google有说下一版的将会是自我对奕出来的版本所以才会这样说吧人类的棋谱也是上千年棋局累积出来的可是电脑自己下,可能几个月就能累积出人类上千年的量从而形成自己的棋谱
作者: moonlind (又多了敷脸卡跟觅食卡了~)   2017-01-05 17:29:00
但是围棋wiki上写的历史 最早围棋跟现在好像布一样不知道现代围棋 大概算是几年的历史
作者: gemini2010 (gemini)   2017-01-05 18:00:00
围棋真的太奥妙,可惜相较之下西方不够盛行,想看东西方各种天才的比拼
作者: shinwind (风)   2017-01-05 18:09:00
楼上 不需要了.接下来让ai带着大家前进
作者: goenitzx   2017-01-05 18:57:00
以后围棋赛变成电脑拼电脑 人类会看热闹可是都看不懂XD
作者: a127 (毛萝卜)   2017-01-05 18:59:00
西洋棋被征服之后还是有职业棋赛阿

Links booklink

Contact Us: admin [ a t ] ucptt.com