Re: [心情] 李世石 Go! Go! Go!

楼主: yamiyodare (shantotto)   2016-03-12 16:57:11
※ 引述《bbbtri (cycling)》之铭言:
: ※ 引述《yamiyodare (shantotto)》之铭言:
: : AI 的做法是先尽量下的跟高手一样, 因为高手可能的下法几乎包含了最佳解.
: : AI 从这些候选走法往下找可以节省大量时间空间.
: : 透过大量的高手对战谱训练出一个迅速模仿高手次一手的 policy network.
: AI 可以转瞬学会所有定石 等于是到地球作战的外星部队一次掌握地球的全部地形
: 所以有大局观可以理解
: 可是, 我不太懂死活要怎么解?因为死活很复杂啊, 隐藏着猪羊变色的规则和劫活
: 还是其实死活的题型和变化在AlphaGo看来存在上限?
碰到一个死活问题, 如果有高手每一步都提点可能的几个位置,
自己摆一摆所有的变化, 最后总是能下活吧.
: : value network 是型势判断, 给予一个特定盘面就能够迅速回报胜率.
: : AI 开出千万分身自我对练高手的棋路到终局 (最后谁赢电脑可以判断的够准)
: : 然后回溯盘面, 训练出一个可以估计任何盘面胜率的 value network.
: (不好意思, 插问一下回溯的英文是什么> <)
: 在序盘就要计算到胜率看起来完全不可思议啊!!!
: 假设AlphaGo vs AlphaGo'(比本体稍弱)的胜率比是51:49好了
: 那这个比值“从第几手开始”才会跳动呢?
: 感觉上, 答案根本上决定在对局两造的实力
AlphaGo 先自我对弈三千万盘出来知道最后的胜负 (电脑有能力自动判断)
然后把 "中途的盘面" 跟 "最后的胜负" 当成一对丢进类神经网络强化连结.
有点像给人看几万张男人 (输) 跟几万张女人 (赢) 的照片.
之后看到没看过的人, 人可以推论是女人 (赢) 的机率有多高.
: : 可以把它想像成很多高手提供次一手的下法, 那就来下下看, 看谁说得对.
: : 但要留意, AI 的目标是胜率最高 (反击手最少), 不是目数最多, 不是棋型最美.
: 不太懂value network为什么是重在反击手最少呢?可以再说明一下吗?
: 说到反击, 我是觉得任何反击都可预期, 只差在“有没有效率”而已
: 而效率除了涉及手数,目数,还关系到手顺, 这点跟收官有最佳顺序一样
: 唯前提是死活的问题要先解决, 因为即使是官子也会受打劫影响
: 你说的反击手最少, 指的是....?
我的用词不当, 反击手指的是可逆转胜负 (翻盘) 的手段
: 如果目前的AI计算能力已经强到甚至能改变定石、争夺手顺, 那....lol
: (定石真的是没有破绽的吗?还是只是地球人的破绽?)
定石会进化, 现在的定石跟古定石就不一样, 秀策遇到贴目也不会尖... 吧
: 宇宙流的相关定石应该很少
: 如果AI要发展宇宙流派, 那也不错呀~~
: 但那样的围棋就不会是我们目前以为的围棋了而是一盘只有AI能下的棋局
: 看新闻说, Google DeepMind 的目光放在破解人类学习的密码
: 嗯, 这个是认知科学的脑神经领域啊!
: 而用只有电脑可以使用的方式(例如暴力归纳)来破解人脑的学习, 是矛盾不是吗?
人类也是暴力归纳啊, 就好像我说的男女识别问题.
你没看过多少人之前判断错误的机会是很高的.
只是电脑更暴力, 很专心又不会累, 可能可以学得比人类更好.
作者: BRANFORD (请保佑我的父亲)   2016-03-12 16:59:00
这个时代 照样尖的职业棋士很多啊 阿对不起该问阿法够
作者: bbbtri (cycling)   2016-03-12 18:02:00
可是今天这盘就是劫活 而黑子劫材不够 也就是死活不是一个封闭的题目 而是要放到盘面上 呼应盘面的情况来定死生男女适别对生物来说是天生的 不是习得的 所以不是归纳喔人如果要使用归纳法 是top-down的high level cognition但类神经元应该没独特性 没有像神经元这样专门性的演化
楼主: yamiyodare (shantotto)   2016-03-12 18:10:00
AlphaGo 的 value network 看的就是整个盘面 解死活同时照顾大局 局部该死该活由整体胜算决定
作者: bbbtri (cycling)   2016-03-12 18:12:00
以视觉辨识来讲 Hubel Wiesel发现的特化刚好启发CNN研究这点我刚在看版友提供的CNN介绍时也吓一跳.....
楼主: yamiyodare (shantotto)   2016-03-12 18:22:00
男女识别举例不佳的话 改成猫狗识别好了
作者: bbbtri (cycling)   2016-03-12 18:31:00
可是识别是识别 归纳是归纳 是不同的概念我只是想说AlphaGo跳过理解而直接下判断 和人类的习惯不同所以是暴力归纳 但我还没搞懂它到底是怎么做出效率的啊

Links booklink

Contact Us: admin [ a t ] ucptt.com