[问题] 若想要自己做出小朋友下楼梯的AI可行吗 hateli PTT批踢踢实业坊

[问题] 若想要自己做出小朋友下楼梯的AI可行吗

楼主: hateli (kk) 2018-03-23 10:06:17

大家好最近小弟突发奇想
很想做出一个可以自动玩小朋友下楼梯的程式(类似alphago)
目前已经看过一些莫凡的强化学习教学影片
也会使用autogui控制键盘鼠标
也看了很多相关资料
但还是有点迷茫不知从何做起
请问各位前辈有没有什么推荐的资源呢
或是这个目标其实很困难
有较基本的练习可以推荐我
感激不尽

作者: Jeffrey11061 (Jeff) 2018-03-23 11:03:00

先能够detect游戏中的物件（？

作者: EGsux (天龙人) 2018-03-23 11:45:00

openAI gym 先玩一下那边的都不用处理游戏内容

作者: Panthalassa 2018-03-23 12:58:00

自己试过 Reinforcement Learning 觉得痛苦XD要调的参数+硬件需求+时间太多了推荐用基因算法来烟化出好的 policy network*演化CNN 搭配基因算法就做得到 youtube 很多影片https://youtu.be/qv6UVOQ0F44

作者: CaptainH (Cannon) 2018-03-23 13:22:00

不是泼冷水 RL实务上成功的例子很少reward很难设计最后几乎都要靠暴力硬解

作者: Panthalassa 2018-03-23 13:26:00

推楼上

作者: vi000246 (Vi) 2018-03-23 16:24:00

有看过用AI贪食蛇下楼梯应该也做得到吧

作者: goldflower (金色小黄花) 2018-03-23 16:37:00

觉得可以这个奖励很单纯只是你要把什么时候是结束之类的定义弄好给程式所以像openai他们把脏活都帮你做好是轻松很多

楼主: hateli (kk) 2018-03-23 17:40:00

可能小弟太菜，看完之后还是没什么想法，会再深入研究一下各位给的资源，感谢

作者: ap954212 (death is like the wings) 2018-03-23 18:19:00

DQN 请参考deeplearning-flappy-bird的github

作者: st1009 (前端攻城师) 2018-03-23 18:27:00

偷宣传一下，现在有AI专版唷 DataScience版

作者: Panthalassa 2018-03-23 19:35:00

既然指定要小朋友下楼梯就没有 openai 的资源了不建议从头刻 RL，变因太多，训练失败的话难 debug 难 tune

作者: bibo9901 (function(){})() 2018-03-24 01:08:00

贪食蛇的AI应该很简单吧...不需要用train的

作者: Panthalassa 2018-03-24 04:39:00

楼上是指 rule based 的吗？用 Train 的不仅是为了让机器玩而是让机器从错误学习，这意义非凡

作者: neil987 (R5大小姐-EX人品崩坏) 2018-03-24 15:52:00

只是我有个疑问是这样会收敛吗

作者: goldflower (金色小黄花) 2018-03-24 17:45:00

exploration没办法让结果更好就能说(希望)收敛惹吧

楼主: hateli (kk) 2018-03-25 15:06:00

各位前辈，如果是改做皮卡丘打排球呢？先单纯左右移动防守这样，若要学习各种球路会比较适合什么算法呢？想说这样会不会简单点

作者: sean50301 ( (づ′・ω・）づ) 2018-03-26 03:14:00

实习有做过用RL调整交易策略的专案 reward真的是关键

继续阅读

pycharm 取得命令列引数snakei14702 [问题] 新手请问大大word档转HTML问题johnnyaj3 [问题] 新手玩RPI3的问题__AD/DA boardvirginbear [问题] numpy套件版本差异PyTorch [问题] 新手请教 GCP nuinx+uwsgioscar0130 [问题] Google图书有推荐的py中文书吗VAIOBIOS Re: [问题] 切字串 split cutekid Re: [问题] 切字串 split shadowjohn Re: [问题] 切字串 split ctr1 [问题] 切字串 split ctr1