[问题] 若想要自己做出小朋友下楼梯的AI可行吗

楼主: hateli (kk)   2018-03-23 10:06:17
大家好 最近小弟突发奇想
很想做出一个可以自动玩小朋友下楼梯的程式(类似alphago)
目前已经看过一些莫凡的强化学习教学影片
也会使用autogui控制键盘鼠标
也看了很多相关资料
但还是有点迷茫不知从何做起
请问各位前辈有没有什么推荐的资源呢
或是这个目标其实很困难
有较基本的练习可以推荐我
感激不尽
作者: Jeffrey11061 (Jeff)   2018-03-23 11:03:00
先能够detect游戏中的物件(?
作者: EGsux (天龙人)   2018-03-23 11:45:00
openAI gym 先玩一下 那边的都不用处理游戏内容
作者: Panthalassa   2018-03-23 12:58:00
自己试过 Reinforcement Learning 觉得痛苦XD要调的参数+硬件需求+时间 太多了推荐用基因算法来烟化出好的 policy network*演化CNN 搭配 基因算法就做得到 youtube 很多影片https://youtu.be/qv6UVOQ0F44
作者: CaptainH (Cannon)   2018-03-23 13:22:00
不是泼冷水 RL实务上成功的例子很少reward很难设计 最后几乎都要靠暴力硬解
作者: Panthalassa   2018-03-23 13:26:00
推楼上
作者: vi000246 (Vi)   2018-03-23 16:24:00
有看过用AI贪食蛇 下楼梯应该也做得到吧
作者: goldflower (金色小黄花)   2018-03-23 16:37:00
觉得可以 这个奖励很单纯只是你要把什么时候是结束之类的定义弄好给程式所以像openai他们把脏活都帮你做好是轻松很多
楼主: hateli (kk)   2018-03-23 17:40:00
可能小弟太菜,看完之后还是没什么想法,会再深入研究一下各位给的资源,感谢
作者: ap954212 (death is like the wings)   2018-03-23 18:19:00
DQN 请参考deeplearning-flappy-bird的github
作者: st1009 (前端攻城师)   2018-03-23 18:27:00
偷宣传一下,现在有AI专版唷 DataScience版
作者: Panthalassa   2018-03-23 19:35:00
既然指定要小朋友下楼梯就没有 openai 的资源了不建议从头刻 RL,变因太多,训练失败的话难 debug 难 tune
作者: bibo9901 (function(){})()   2018-03-24 01:08:00
贪食蛇的AI应该很简单吧...不需要用train的
作者: Panthalassa   2018-03-24 04:39:00
楼上是指 rule based 的吗?用 Train 的不仅是为了让机器玩而是让机器从错误学习,这意义非凡
作者: neil987 (R5大小姐-EX人品崩坏)   2018-03-24 15:52:00
只是我有个疑问是 这样会收敛吗
作者: goldflower (金色小黄花)   2018-03-24 17:45:00
exploration没办法让结果更好 就能说(希望)收敛惹吧
楼主: hateli (kk)   2018-03-25 15:06:00
各位前辈,如果是改做皮卡丘打排球呢?先单纯左右移动防守这样,若要学习各种球路会比较适合什么算法呢?想说这样会不会简单点
作者: sean50301 ( (づ′・ω・)づ)   2018-03-26 03:14:00
实习有做过用RL调整交易策略的专案 reward真的是关键

Links booklink

Contact Us: admin [ a t ] ucptt.com