Re: [讨论] 浅谈AlphaGo

楼主: bigelephants (.__./)   2017-01-05 11:46:34
※ 引述《nnlisalive (nnlisalive)》之铭言:
: ※ 引述《ykes60513 (いちご)》之铭言:
: : 假设A走法有90%赢一目 B走法有85%赢十目 AlphaGo会选前者
: 请问有谁知道90%或85%是怎计算出来的?
: 因为对手还没下 需要跑循环运算
: 这胜率统计是否有所谓的信赖区间
: 再来是会不会有100%胜率落子的时候
: 当100%的路一出现 是否就代表比赛结束
: 去年AG对上李 我看那个落子机率会忽高忽低
: 虽然大部分的时候是50~100%递增
: 但李 v.s AG大战第4局的78手 顿时让AG胜率下降不少
: 是否代表只要我们能下出Alpha世界线以外的棋
: 就能迎接胜利的美好未来?
小弟这学期有修电脑对局理论的相关课程
看到这篇想说分享一下好了
我们上一次的作业是要做黑白棋的 AI
使用的方法就是蒙地卡罗搜寻树 (跟 AlphaGo 比起来只是菜而已)
考虑当前我可以下的每一步棋的情况下
我们都可以假设“双方棋手只会乱数下棋”
并且去计算每一步可行的棋所乱数出来的盘面胜率有多少
这里的胜率是指最终盘面 可以想像电脑乱数把一盘棋下完只要几毫秒的时间
我自己做出来的实验一秒内算个一万多盘棋是没有问题的
概念上其实就是随机抽样而已
关于使用到的技术 其实还有各式各样的优化
并且让电脑接续前一步下的棋思考也并非难事 (实作上不难)
因此电脑暖机越久想得越清楚 越接近实际上的乱数胜率(非真实胜率)
作者: aaaba (小强)   2017-01-05 11:49:00
暖机是什么?
楼主: bigelephants (.__./)   2017-01-05 11:50:00
因为电脑思路是树状的 他可以保留对手走的路径 其他砍掉 抱歉没有讲得很清楚大致上就是他可以利用前面几手耗时所想的东西继续想
作者: politics (politician)   2017-01-05 12:38:00
半桶水的大学作业就别说在这边说嘴了 真的懂再来说
作者: aaaba (小强)   2017-01-05 12:41:00
他是在说他对mcts的理解,也是回应上一篇的疑问。其他人觉得想补充的也欢迎啊
作者: qqq1397 (浑汲噩营)   2017-01-05 12:57:00
这种还不能说?不懂装逼的废文多到腻
作者: ddavid (谎言接线生)   2017-01-05 13:05:00
大致上讲得没错啊,不知道476上站1发文的politics大大有何更详细的见解
作者: politics (politician)   2017-01-05 13:18:00
https://goo.gl/U5ypHp 英文看不懂的话看强国人讲大纲https://www.zhihu.com/question/41176911这篇自己都说没看过deepmind的论文了 屁这些有价值吗?mcts这只是个名词 我用ooxx游戏都可以跟你说明但deeplearn不是单纯的mcts 就降
楼主: bigelephants (.__./)   2017-01-05 13:23:00
哈哈我有空会拜读一波!
作者: ddavid (谎言接线生)   2017-01-05 13:29:00
不是纯粹的MCTS没错,但会无法直接算出100%胜率的理由确实是因为这一块,他讲的还是有打在点上啊,或者您想要补充更详细的其他方面理由?
作者: indium111 (#ttyhg)   2017-01-05 13:53:00
就跟选情统计一样,抽样越大就越接近真实的结果
作者: freef1y3 ( )   2017-01-05 14:35:00
deep learning 就只是用来剪枝 & 选择要先试哪一手这概念也是可以用在其他游戏上啊

Links booklink

Contact Us: admin [ a t ] ucptt.com