Re: [心情] 李世石 Go! Go! Go! yamiyodare PTT批踢踢实业坊

Re: [心情] 李世石 Go! Go! Go!

楼主: yamiyodare (shantotto) 2016-03-12 16:57:11

※ 引述《bbbtri (cycling)》之铭言：
: ※ 引述《yamiyodare (shantotto)》之铭言：
: : AI 的做法是先尽量下的跟高手一样, 因为高手可能的下法几乎包含了最佳解.
: : AI 从这些候选走法往下找可以节省大量时间空间.
: : 透过大量的高手对战谱训练出一个迅速模仿高手次一手的 policy network.
: AI 可以转瞬学会所有定石等于是到地球作战的外星部队一次掌握地球的全部地形
: 所以有大局观可以理解
: 可是, 我不太懂死活要怎么解？因为死活很复杂啊, 隐藏着猪羊变色的规则和劫活
: 还是其实死活的题型和变化在AlphaGo看来存在上限？
碰到一个死活问题, 如果有高手每一步都提点可能的几个位置,
自己摆一摆所有的变化, 最后总是能下活吧.
: : value network 是型势判断, 给予一个特定盘面就能够迅速回报胜率.
: : AI 开出千万分身自我对练高手的棋路到终局 (最后谁赢电脑可以判断的够准)
: : 然后回溯盘面, 训练出一个可以估计任何盘面胜率的 value network.
: (不好意思, 插问一下回溯的英文是什么> <)
: 在序盘就要计算到胜率看起来完全不可思议啊!!!
: 假设AlphaGo vs AlphaGo'(比本体稍弱)的胜率比是51:49好了
: 那这个比值“从第几手开始”才会跳动呢？
: 感觉上, 答案根本上决定在对局两造的实力
AlphaGo 先自我对弈三千万盘出来知道最后的胜负 (电脑有能力自动判断)
然后把 "中途的盘面" 跟 "最后的胜负" 当成一对丢进类神经网络强化连结.
有点像给人看几万张男人 (输) 跟几万张女人 (赢) 的照片.
之后看到没看过的人, 人可以推论是女人 (赢) 的机率有多高.
: : 可以把它想像成很多高手提供次一手的下法, 那就来下下看, 看谁说得对.
: : 但要留意, AI 的目标是胜率最高 (反击手最少), 不是目数最多, 不是棋型最美.
: 不太懂value network为什么是重在反击手最少呢？可以再说明一下吗？
: 说到反击, 我是觉得任何反击都可预期, 只差在“有没有效率”而已
: 而效率除了涉及手数，目数，还关系到手顺, 这点跟收官有最佳顺序一样
: 唯前提是死活的问题要先解决, 因为即使是官子也会受打劫影响
: 你说的反击手最少, 指的是....？
我的用词不当, 反击手指的是可逆转胜负 (翻盘) 的手段
: 如果目前的AI计算能力已经强到甚至能改变定石、争夺手顺, 那....lol
: (定石真的是没有破绽的吗？还是只是地球人的破绽？)
定石会进化, 现在的定石跟古定石就不一样, 秀策遇到贴目也不会尖... 吧
: 宇宙流的相关定石应该很少
: 如果AI要发展宇宙流派, 那也不错呀～～
: 但那样的围棋就不会是我们目前以为的围棋了而是一盘只有AI能下的棋局
: 看新闻说, Google DeepMind 的目光放在破解人类学习的密码
: 嗯, 这个是认知科学的脑神经领域啊!
: 而用只有电脑可以使用的方式(例如暴力归纳)来破解人脑的学习, 是矛盾不是吗？
人类也是暴力归纳啊, 就好像我说的男女识别问题.
你没看过多少人之前判断错误的机会是很高的.
只是电脑更暴力, 很专心又不会累, 可能可以学得比人类更好.

作者: BRANFORD (请保佑我的父亲) 2016-03-12 16:59:00

这个时代照样尖的职业棋士很多啊阿对不起该问阿法够

作者: bbbtri (cycling) 2016-03-12 18:02:00

可是今天这盘就是劫活而黑子劫材不够也就是死活不是一个封闭的题目而是要放到盘面上呼应盘面的情况来定死生男女适别对生物来说是天生的不是习得的所以不是归纳喔人如果要使用归纳法是top-down的high level cognition但类神经元应该没独特性没有像神经元这样专门性的演化

楼主: yamiyodare (shantotto) 2016-03-12 18:10:00

AlphaGo 的 value network 看的就是整个盘面解死活同时照顾大局局部该死该活由整体胜算决定

作者: bbbtri (cycling) 2016-03-12 18:12:00

以视觉辨识来讲 Hubel Wiesel发现的特化刚好启发CNN研究这点我刚在看版友提供的CNN介绍时也吓一跳.....

楼主: yamiyodare (shantotto) 2016-03-12 18:22:00

男女识别举例不佳的话改成猫狗识别好了

作者: bbbtri (cycling) 2016-03-12 18:31:00

可是识别是识别归纳是归纳是不同的概念我只是想说AlphaGo跳过理解而直接下判断和人类的习惯不同所以是暴力归纳但我还没搞懂它到底是怎么做出效率的啊

继续阅读

[讨论] 阿发狗要繁殖小baby了？aaaba [新闻] 柯洁：对AlphaGo胜算最低六成李像安乐死zkow [闲聊] 感觉阿法狗电脑棋力要算11段laidos Re: [讨论] 想到一个赢电脑的方法了anivia0428 [新闻] 李世石顽强拼搏精神可嘉人机大战三连败zkow [闲聊] 帮忙alphago下棋的人想上厕所怎么办dudu5566 [新闻] 科学视角解读 AI3-5年内将赢遍人类棋手 zkow Re: [LIVE]人机围碁世纪大战 - 3McEliece5566 [讨论] alphago赢了andrenvq57 [讨论] 想到一个赢电脑的方法了McHamburger